共计 1059 个字符,预计需要花费 3 分钟才能阅读完成。
OpenAI 终于推出了 ChatGPT 的实时视频功能,这个功能其实早在七个月前就已经展示过了。在最近的直播中,他们宣布为 ChatGPT 设计的高级语音模式(Advanced Voice Mode)现在增加了视觉功能。这意味着,如果你是 ChatGPT Plus、Team 或 Pro 的订阅用户,你可以用手机对着某个物体,ChatGPT 几乎可以实时地给出反馈。
这个新功能不仅能听,还能看。它可以通过屏幕共享来理解设备屏幕上的内容,比如解释各种设置菜单,或者在数学问题上给出建议。要启动这个功能,你只需要点击 ChatGPT 聊天栏旁边的语音图标,然后点击左下角的视频图标。如果你想共享屏幕,点击三点菜单并选择“共享屏幕”就行了。
不过,这个功能的推出并不是一蹴而就的。OpenAI 表示,从周四开始,这个功能会逐步推出,预计下周完成。但并不是所有用户都能马上用到。ChatGPT Enterprise 和 Edu 的订阅用户要等到明年 1 月才能体验到这个功能。至于欧盟、瑞士、冰岛、挪威或列支敦士登的用户,目前还没有明确的推出时间表。
最近,在 CBS 新闻的“60 分钟”节目中,OpenAI 总裁 Greg Brockman 用这个新功能测试了 Anderson Cooper 的解剖学知识。当 Cooper 在黑板上画出身体部位时,ChatGPT 竟然能“看懂”他画的内容,并给出了准确的反馈。不过,在同一个演示中,这个功能在几何问题上却出现了错误,显示出它有时会“产生幻觉”。
这个功能的推出其实已经推迟了好几次。据说,部分原因是 OpenAI 在功能还没完全准备好时就宣布了它。今年 4 月,他们承诺这个功能会在“几周内”推出,但后来又表示需要更多时间。直到今年初秋,高级语音模式才为部分 ChatGPT 用户推出,但当时还没有视觉分析组件。在周四发布之前,OpenAI 一直在努力将仅语音的高级语音模式带到更多平台和欧盟的用户。
与此同时,Google 和 Meta 等竞争对手也在为他们的聊天机器人开发类似的功能。比如,Google 最近将其实时视频分析对话 AI 功能——Project Astra,提供给了 Android 上的一组“可信测试者”。
除了这个视觉功能,OpenAI 还在周四推出了一个有趣的节日模式——“圣诞老人模式”(Santa Mode)。这个模式在 ChatGPT 中加入了圣诞老人的声音作为预设声音。你只需要点击 ChatGPT 应用程序中提示栏旁边的雪花图标,就能体验到这个有趣的圣诞老人声音。
总的来说,OpenAI 的这个新功能还是挺有意思的,虽然还有一些小问题,但未来应该会越来越完善。