Google Gemini 新功能：Canvas与Audio Overviews详解

177次阅读

共计 866 个字符，预计需要花费 3 分钟才能阅读完成。

Google 最新发布的 Gemini 模型在其旗舰 AI 产品中新增了两项引人注目的功能：Canvas 和 Audio Overviews。这两项功能不仅扩展了 Gemini 的应用范围，也提升了用户体验，使其成为处理文档、代码和音频内容的强大工具。

Canvas 功能允许用户在 Gemini 平台上直接起草、编辑和完善文档或代码。这一功能在网页和移动应用的 Gemini 提示栏中均可使用。用户只需上传文档并指示 Gemini 进行特定操作，例如根据课堂笔记的 PDF 生成演讲稿。Canvas 还支持用户在 Gemini 内部直接完善 AI 生成的文档，并提供多种写作工具，如建议编辑和不同语气选项。此外，用户可以将文档一键导出到 Google Docs，以便进行更多编辑或与他人协作。

Google Gemini 新功能：Canvas 与 Audio Overviews 详解

Canvas 在编码方面也表现出色。用户只需提出要求，Canvas 就可以生成原型 Web 应用、Python 脚本、HTML 等。用户还可以在 Gemini 内部实时预览代码的修改结果，无论是由用户还是 AI 进行更改。

Audio Overviews 功能则是首次出现在 Google 的 NotebookLM 产品中，现在作为 Gemini 的一部分变得更加实用。该功能允许用户上传文档，AI 会吸收数据并生成两个虚构人物之间的对话，类似于播客风格的讨论。用户只需上传文档并在提示栏上方找到“生成音频概览”按钮即可使用此功能。需要注意的是，生成音频需要几分钟时间，即使文本量相对较小。

Audio Overviews 还与 Deep Research 集成，这是一个可以代表用户浏览互联网的 AI 代理。Google 最近将 Deep Research 的有限使用免费开放，现在用户可以对那些报告进行更多操作。在查看 Deep Research 的结果时，用户现在可以从报告中生成音频概览。

Google 表示，Canvas 和 Audio Overviews 面向全球所有用户开放，即使是 Google AI 的免费版本。然而，目前 Audio Overviews 仅支持英语，该公司承诺未来将支持更多语言。这两项新功能的推出，无疑将进一步巩固 Gemini 在 AI 领域的领先地位。

正文完