共计 1541 个字符,预计需要花费 4 分钟才能阅读完成。
Minesweeper”,这是一个 AI 主持人讨论关于 Minesweeper 书籍的播客!” />
作为一个一直关注生成式 AI 发展的人,我知道这项技术可以相当不错,即使还没有达到人类水平,能够快速将复杂文档总结成更易消化的形式。但我仍然没有准备好,听到 Google 的 NotebookLM 将我最近关于《Minesweeper》的书籍浓缩成一个紧凑的 12.5 分钟播客式对话,这个对话是由两个不存在的人进行的,这种感觉是多么令人难以抗拒。
NotebookLM 的音频输出仍然存在足够多的显著问题,使其无法在短期内完全取代专业播客主持人。即便如此,这种播客式的格式是一种非常吸引人和令人愉悦的方式来吸收复杂信息,并预示着生成式 AI 比基于文本的聊天机器人那种枯燥的来回对话更具人情味的未来。
Google 的 NotebookLM 一年多前推出,作为“一个可以根据您选择的来源总结事实、解释复杂想法和激发新联系的虚拟研究助手”。就在上周,Google 添加了新的“音频概述”功能,将其宣传为“将您的文档转化为引人入胜的音频讨论的新方式”。
Google 在那次公告中没有使用“播客”这个词,而是强调了“总结您的材料,建立主题之间的联系,并来回交谈”的音频创作。但沃顿商学院 AI 教授 Ethan Mollick 在最近的一条社交媒体帖子中正确地将这种风格称为“播客”,该帖子分享了 NotebookLM 对他的书籍的音频概述。Mollick 称这些音频总结为“目前最好的‘哇,这太棒了,很有用’的 AI 演示”,并且“也令人不安”,我们在这两点上完全同意。
受到 Mollick 帖子的启发,我决定将我自己的书籍输入 NotebookLM,看看它的虚拟“播客主持人”会如何处理关于 90 年代 Windows 游戏经典《Minesweeper》的 30,000 字左右的内容。仅仅几分钟后,我就体验到了如果我被邀请参加 NPR 的 Pop Culture Happy Hour 或类似充满对话的播客会是什么感觉。
NotebookLM 的总结涵盖了书籍的所有主要部分:启发《Minesweeper》的游戏的早期历史;Windows Entertainment Pack 在 90 年代以商业为中心的微软公司中的艰难斗争;游戏预装在数百万商业和政府计算机上引发的道德恐慌;以及围绕游戏竞技场景的意外作弊争议。
当然,我可以对总结决定关注和 / 或忽略的具体部分进行挑剔。但任何人收听这个“播客”都会得到与我书籍相同的总体概述,就像收听其中一个实际播客一样,这些播客在我书籍发布后我参与了。
虽然 NotebookLM 的总结“播客”中没有出现完全的、全新的幻觉,但在某些地方它确实搞错了一些小细节或做出了文本中没有支持的假设。例如,在讨论《Minesweeper》的前身《Mined-Out》时,NotebookLM 的音频总结说:“所以这就是那些方块和旗帜开始发挥作用的地方……”尽管《Mined-Out》并没有这些功能。
然后是总结中提到一位参议员称《Minesweeper》为“共和国的威胁”的部分,重复了这句话以示强调。这确实捕捉到了参议员 Lauch Faircloth 对《Minesweeper》和其他预装在政府计算机上的游戏的抨击精神。但在“播客”的背景下,这听起来像是声音在 Faircloth 的嘴里放话,分享了一个直接引述。
像这样的小错误——以及播客中完全遗漏的书籍的一些关键部分——如果我试图使用 NotebookLM 的总结作为学术文章或新闻报道的基础,我会犹豫。但我可以看到使用这样的总结来快速获取关于一本我没有时间或意愿完全阅读的厚书的 Cliff’s Notes 式基础知识。而且,与浏览 Cliff’s Notes 不同,这种简洁的播客式格式实际上可以作为外出散步或处理杂务时的愉快背景噪音。