共计 691 个字符,预计需要花费 2 分钟才能阅读完成。
索尼近日展示了一项由 AI 技术驱动的创新功能,使其 PlayStation 游戏角色能够与玩家进行实时对话。据《The Verge》报道,这一技术首次在《地平线:西部禁域》中的角色 Aloy 身上进行了演示。
一段现已删除的视频展示了这一技术的应用。在视频中,Aloy 不仅能够通过语音提示与玩家互动,还能通过合成语音和面部表情回答问题。例如,当被问及她的感受时,Aloy 稍作停顿后回答:“还好,只是喉咙有点痛。”这种互动在游戏的不同场景中均能流畅进行,包括在游戏过程中回答玩家关于地点和时间的查询。尽管 Aloy 的回答有时显得较为模糊,例如她只能描述“下午且天气炎热”而非具体时间,但整体效果仍令人印象深刻。
然而,这种技术也引发了一些争议。当 Aloy 被提示向观众告别并表示感谢时,其机械的语音营造出一种诡异的氛围,让部分观众感到不适。
索尼在开发这一原型时,采用了多种先进的 AI 模型,包括 GPT-4 和 Llama 3,用于支持决策和对话生成。此外,OpenAI 的 Whisper 技术被用于语音到文本的转换。索尼还使用了其自主研发的情感语音合成(EVS)系统和 Mockingbird 技术,进行语音生成和音频到面部动画的转换,尽管这些技术尚未被广泛讨论。
值得注意的是,NVIDIA 和 微软 也在开发类似的技术。NVIDIA 的 ACE 技术已经用于创建 AI 驱动的 NPC 对话,但这一技术同样引发了争议。Engadget 的高级编辑 Devindra Hardawar 曾表示,连续观看几个 NVIDIA ACE 的演示让他感到“非常不适”。
索尼的这一创新无疑为游戏互动带来了新的可能性,但也引发了关于 AI 技术在娱乐行业中应用的广泛讨论。