亚马逊推出Nova AI模型,加速生成语音和视频技术竞争

26次阅读
没有评论

共计 500 个字符,预计需要花费 2 分钟才能阅读完成。

亚马逊近日发布了全新的 Nova Sonic AI 技术,这一实时语音应答系统旨在与谷歌的 Gemini 和 OpenAI 的 GPT-4o 等先进技术展开竞争。同时,亚马逊还更新了其生成视频的模型,进一步巩固其在 AI 领域的技术地位。

亚马逊推出 Nova AI 模型,加速生成语音和视频技术竞争

Nova Sonic 是亚马逊在 AI 语音处理领域的最新成果,采用了“统一模型架构”,这一架构被认为在处理语音识别、语音到文本转换、响应生成及文本到音频的整个流程中,比传统方法更为高效。亚马逊强调,Nova Sonic 不仅能更准确地检测对话者的语气,还能提供更为自然的响应,这使其在实时对话应用中表现出色。

目前,Nova Sonic 已通过亚马逊的 Bedrock 开发者平台开放试用,适用于客户服务机器人以及旅游、教育、医疗保健等多个行业的 AI 代理开发。亚马逊 AGI 高级副总裁兼首席科学家 Rohit Prasad 透露,Nova Sonic 的部分技术已应用于最新的 Alexa Plus 助手中。

在视频生成方面,亚马逊推出了 Nova Reel 1.1,相比前代版本,其视频质量和处理速度均有显著提升。新版本支持在多个六秒场景中保持一致的风格,并能将这些场景剪辑成长达两分钟的完整视频,为用户提供更丰富的内容创作工具。

亚马逊推出 Nova AI 模型,加速生成语音和视频技术竞争

正文完
 0
admin-gah
版权声明:本文于2025-04-09转载自TheVerge,共计500字。
转载提示:此文章非本站原创文章,若需转载请联系原作者获得转载授权。
评论(没有评论)
验证码