OpenAI推出ChatGPT实时视频功能，带来全新互动体验

218次阅读

共计 1059 个字符，预计需要花费 3 分钟才能阅读完成。

OpenAI 终于推出了 ChatGPT 的实时视频功能，这个功能其实早在七个月前就已经展示过了。在最近的直播中，他们宣布为 ChatGPT 设计的高级语音模式（Advanced Voice Mode）现在增加了视觉功能。这意味着，如果你是 ChatGPT Plus、Team 或 Pro 的订阅用户，你可以用手机对着某个物体，ChatGPT 几乎可以实时地给出反馈。

这个新功能不仅能听，还能看。它可以通过屏幕共享来理解设备屏幕上的内容，比如解释各种设置菜单，或者在数学问题上给出建议。要启动这个功能，你只需要点击 ChatGPT 聊天栏旁边的语音图标，然后点击左下角的视频图标。如果你想共享屏幕，点击三点菜单并选择“共享屏幕”就行了。

OpenAI 推出 ChatGPT 实时视频功能，带来全新互动体验

不过，这个功能的推出并不是一蹴而就的。OpenAI 表示，从周四开始，这个功能会逐步推出，预计下周完成。但并不是所有用户都能马上用到。ChatGPT Enterprise 和 Edu 的订阅用户要等到明年 1 月才能体验到这个功能。至于欧盟、瑞士、冰岛、挪威或列支敦士登的用户，目前还没有明确的推出时间表。

最近，在 CBS 新闻的“60 分钟”节目中，OpenAI 总裁 Greg Brockman 用这个新功能测试了 Anderson Cooper 的解剖学知识。当 Cooper 在黑板上画出身体部位时，ChatGPT 竟然能“看懂”他画的内容，并给出了准确的反馈。不过，在同一个演示中，这个功能在几何问题上却出现了错误，显示出它有时会“产生幻觉”。

这个功能的推出其实已经推迟了好几次。据说，部分原因是 OpenAI 在功能还没完全准备好时就宣布了它。今年 4 月，他们承诺这个功能会在“几周内”推出，但后来又表示需要更多时间。直到今年初秋，高级语音模式才为部分 ChatGPT 用户推出，但当时还没有视觉分析组件。在周四发布之前，OpenAI 一直在努力将仅语音的高级语音模式带到更多平台和欧盟的用户。

与此同时，Google 和 Meta 等竞争对手也在为他们的聊天机器人开发类似的功能。比如，Google 最近将其实时视频分析对话 AI 功能——Project Astra，提供给了 Android 上的一组“可信测试者”。

除了这个视觉功能，OpenAI 还在周四推出了一个有趣的节日模式——“圣诞老人模式”（Santa Mode）。这个模式在 ChatGPT 中加入了圣诞老人的声音作为预设声音。你只需要点击 ChatGPT 应用程序中提示栏旁边的雪花图标，就能体验到这个有趣的圣诞老人声音。

总的来说，OpenAI 的这个新功能还是挺有意思的，虽然还有一些小问题，但未来应该会越来越完善。

正文完