共计 774 个字符,预计需要花费 2 分钟才能阅读完成。
自 OpenAI 推出了 ChatGPT 的新高级语音模式以来,已经过去几天了,目前获得访问权限的一小部分 ChatGPT Plus 订阅者似乎对此印象深刻。各种展示该功能实际应用的片段已在网上出现,展示了其唱歌、模仿口音、纠正语言发音和进行叙事讲故事的能力。
例如,X 用户 @nickfloats 要求 ChatGPT“像航空公司飞行员在飞行中向乘客讲述故事一样”。聊天机器人几乎在下一秒就立即开始行动,甚至调整音频以听起来更像是从对讲机传来的。ChatGPT 在处理更复杂的请求如叠加引擎声音方面遇到困难,但语音本身清晰且富有情感,ChatGPT 也能很好地处理用户中断。
在一则上传到 YouTube 的对话中,ChatGPT 表示它可以处理“数十种语言”的输入,但确切数量可能“取决于你如何计算方言和地区变体”。一段视频展示了聊天机器人纠正法语单词发音的能力,给出了具体的调整语调的指导。另一段语言演示展示了 ChatGPT 用土耳其语讲述一个情感故事,这是在遵循一个详细的请求后进行的。尽管一些土耳其 X 用户指出口音听起来不像是本地人,但它能够完成故事请求,并在某些点上适当地笑和哭。
该机器人在处理美国地区口音方面做得不错,一段视频展示了包括纽约、波士顿、威斯康星和一个典型的“山谷女孩”在内的多种例子。其他视频还展示了 ChatGPT 的高级语音功能以不同风格唱歌,产生了蓝调风格的“生日快乐”,有趣的是,还尝试模仿青蛙和猫等动物唱歌的声音。
在这些演示中出现了几种不同性别(男性和女性)的声音,尽管这些声音并不包括五月从服务中移除的类似斯嘉丽·约翰逊的“Sky”声音。
至于那些感觉被排除在这些有趣演示之外的人,OpenAI 发言人 Taya Christianson 告诉_The Verge_,高级语音模式将在今年秋季某个时候向所有 ChatGPT Plus 订阅者(每月费用为 20 美元)开放。