亚马逊推出Nova AI模型，加速生成语音和视频技术竞争

145次阅读

共计 500 个字符，预计需要花费 2 分钟才能阅读完成。

亚马逊近日发布了全新的 Nova Sonic AI 技术，这一实时语音应答系统旨在与谷歌的 Gemini 和 OpenAI 的 GPT-4o 等先进技术展开竞争。同时，亚马逊还更新了其生成视频的模型，进一步巩固其在 AI 领域的技术地位。

亚马逊推出 Nova AI 模型，加速生成语音和视频技术竞争

Nova Sonic 是亚马逊在 AI 语音处理领域的最新成果，采用了“统一模型架构”，这一架构被认为在处理语音识别、语音到文本转换、响应生成及文本到音频的整个流程中，比传统方法更为高效。亚马逊强调，Nova Sonic 不仅能更准确地检测对话者的语气，还能提供更为自然的响应，这使其在实时对话应用中表现出色。

目前，Nova Sonic 已通过亚马逊的 Bedrock 开发者平台开放试用，适用于客户服务机器人以及旅游、教育、医疗保健等多个行业的 AI 代理开发。亚马逊 AGI 高级副总裁兼首席科学家 Rohit Prasad 透露，Nova Sonic 的部分技术已应用于最新的 Alexa Plus 助手中。

在视频生成方面，亚马逊推出了 Nova Reel 1.1，相比前代版本，其视频质量和处理速度均有显著提升。新版本支持在多个六秒场景中保持一致的风格，并能将这些场景剪辑成长达两分钟的完整视频，为用户提供更丰富的内容创作工具。

亚马逊推出 Nova AI 模型，加速生成语音和视频技术竞争