共计 500 个字符,预计需要花费 2 分钟才能阅读完成。
亚马逊近日发布了全新的 Nova Sonic AI 技术,这一实时语音应答系统旨在与谷歌的 Gemini 和 OpenAI 的 GPT-4o 等先进技术展开竞争。同时,亚马逊还更新了其生成视频的模型,进一步巩固其在 AI 领域的技术地位。
Nova Sonic 是亚马逊在 AI 语音处理领域的最新成果,采用了“统一模型架构”,这一架构被认为在处理语音识别、语音到文本转换、响应生成及文本到音频的整个流程中,比传统方法更为高效。亚马逊强调,Nova Sonic 不仅能更准确地检测对话者的语气,还能提供更为自然的响应,这使其在实时对话应用中表现出色。
目前,Nova Sonic 已通过亚马逊的 Bedrock 开发者平台开放试用,适用于客户服务机器人以及旅游、教育、医疗保健等多个行业的 AI 代理开发。亚马逊 AGI 高级副总裁兼首席科学家 Rohit Prasad 透露,Nova Sonic 的部分技术已应用于最新的 Alexa Plus 助手中。
在视频生成方面,亚马逊推出了 Nova Reel 1.1,相比前代版本,其视频质量和处理速度均有显著提升。新版本支持在多个六秒场景中保持一致的风格,并能将这些场景剪辑成长达两分钟的完整视频,为用户提供更丰富的内容创作工具。
正文完