共计 866 个字符,预计需要花费 3 分钟才能阅读完成。
Google 最新发布的 Gemini 模型在其旗舰 AI 产品中新增了两项引人注目的功能:Canvas 和 Audio Overviews。这两项功能不仅扩展了 Gemini 的应用范围,也提升了用户体验,使其成为处理文档、代码和音频内容的强大工具。
Canvas 功能允许用户在 Gemini 平台上直接起草、编辑和完善文档或代码。这一功能在网页和移动应用的 Gemini 提示栏中均可使用。用户只需上传文档并指示 Gemini 进行特定操作,例如根据课堂笔记的 PDF 生成演讲稿。Canvas 还支持用户在 Gemini 内部直接完善 AI 生成的文档,并提供多种写作工具,如建议编辑和不同语气选项。此外,用户可以将文档一键导出到 Google Docs,以便进行更多编辑或与他人协作。
Canvas 在编码方面也表现出色。用户只需提出要求,Canvas 就可以生成原型 Web 应用、Python 脚本、HTML 等。用户还可以在 Gemini 内部实时预览代码的修改结果,无论是由用户还是 AI 进行更改。
Audio Overviews 功能则是首次出现在 Google 的 NotebookLM 产品中,现在作为 Gemini 的一部分变得更加实用。该功能允许用户上传文档,AI 会吸收数据并生成两个虚构人物之间的对话,类似于播客风格的讨论。用户只需上传文档并在提示栏上方找到“生成音频概览”按钮即可使用此功能。需要注意的是,生成音频需要几分钟时间,即使文本量相对较小。
Audio Overviews 还与 Deep Research 集成,这是一个可以代表用户浏览互联网的 AI 代理。Google 最近将 Deep Research 的有限使用免费开放,现在用户可以对那些报告进行更多操作。在查看 Deep Research 的结果时,用户现在可以从报告中生成音频概览。
Google 表示,Canvas 和 Audio Overviews 面向全球所有用户开放,即使是 Google AI 的免费版本。然而,目前 Audio Overviews 仅支持英语,该公司承诺未来将支持更多语言。这两项新功能的推出,无疑将进一步巩固 Gemini 在 AI 领域的领先地位。