OpenAI的ChatGPT高级语音模式体验

378次阅读

共计 774 个字符，预计需要花费 2 分钟才能阅读完成。

自 OpenAI 推出了 ChatGPT 的新高级语音模式以来，已经过去几天了，目前获得访问权限的一小部分 ChatGPT Plus 订阅者似乎对此印象深刻。各种展示该功能实际应用的片段已在网上出现，展示了其唱歌、模仿口音、纠正语言发音和进行叙事讲故事的能力。

例如，X 用户 @nickfloats 要求 ChatGPT“像航空公司飞行员在飞行中向乘客讲述故事一样”。聊天机器人几乎在下一秒就立即开始行动，甚至调整音频以听起来更像是从对讲机传来的。ChatGPT 在处理更复杂的请求如叠加引擎声音方面遇到困难，但语音本身清晰且富有情感，ChatGPT 也能很好地处理用户中断。

在一则上传到 YouTube 的对话中，ChatGPT 表示它可以处理“数十种语言”的输入，但确切数量可能“取决于你如何计算方言和地区变体”。一段视频展示了聊天机器人纠正法语单词发音的能力，给出了具体的调整语调的指导。另一段语言演示展示了 ChatGPT 用土耳其语讲述一个情感故事，这是在遵循一个详细的请求后进行的。尽管一些土耳其 X 用户指出口音听起来不像是本地人，但它能够完成故事请求，并在某些点上适当地笑和哭。

该机器人在处理美国地区口音方面做得不错，一段视频展示了包括纽约、波士顿、威斯康星和一个典型的“山谷女孩”在内的多种例子。其他视频还展示了 ChatGPT 的高级语音功能以不同风格唱歌，产生了蓝调风格的“生日快乐”，有趣的是，还尝试模仿青蛙和猫等动物唱歌的声音。

在这些演示中出现了几种不同性别（男性和女性）的声音，尽管这些声音并不包括五月从服务中移除的类似斯嘉丽·约翰逊的“Sky”声音。

至于那些感觉被排除在这些有趣演示之外的人，OpenAI 发言人 Taya Christianson 告诉_The Verge_，高级语音模式将在今年秋季某个时候向所有 ChatGPT Plus 订阅者（每月费用为 20 美元）开放。

正文完

发表至： AI应用大全

2024-08-01 20:05

0