Google Gemini 新功能:Canvas与Audio Overviews详解

48次阅读
没有评论

共计 866 个字符,预计需要花费 3 分钟才能阅读完成。

Google 最新发布的 Gemini 模型在其旗舰 AI 产品中新增了两项引人注目的功能:Canvas 和 Audio Overviews。这两项功能不仅扩展了 Gemini 的应用范围,也提升了用户体验,使其成为处理文档、代码和音频内容的强大工具。

Canvas 功能允许用户在 Gemini 平台上直接起草、编辑和完善文档或代码。这一功能在网页和移动应用的 Gemini 提示栏中均可使用。用户只需上传文档并指示 Gemini 进行特定操作,例如根据课堂笔记的 PDF 生成演讲稿。Canvas 还支持用户在 Gemini 内部直接完善 AI 生成的文档,并提供多种写作工具,如建议编辑和不同语气选项。此外,用户可以将文档一键导出到 Google Docs,以便进行更多编辑或与他人协作。

Google Gemini 新功能:Canvas 与 Audio Overviews 详解

Canvas 在编码方面也表现出色。用户只需提出要求,Canvas 就可以生成原型 Web 应用、Python 脚本、HTML 等。用户还可以在 Gemini 内部实时预览代码的修改结果,无论是由用户还是 AI 进行更改。

Audio Overviews 功能则是首次出现在 Google 的 NotebookLM 产品中,现在作为 Gemini 的一部分变得更加实用。该功能允许用户上传文档,AI 会吸收数据并生成两个虚构人物之间的对话,类似于播客风格的讨论。用户只需上传文档并在提示栏上方找到“生成音频概览”按钮即可使用此功能。需要注意的是,生成音频需要几分钟时间,即使文本量相对较小。

Audio Overviews 还与 Deep Research 集成,这是一个可以代表用户浏览互联网的 AI 代理。Google 最近将 Deep Research 的有限使用免费开放,现在用户可以对那些报告进行更多操作。在查看 Deep Research 的结果时,用户现在可以从报告中生成音频概览。

Google 表示,Canvas 和 Audio Overviews 面向全球所有用户开放,即使是 Google AI 的免费版本。然而,目前 Audio Overviews 仅支持英语,该公司承诺未来将支持更多语言。这两项新功能的推出,无疑将进一步巩固 Gemini 在 AI 领域的领先地位。

正文完
 0
admin-gah
版权声明:本文于2025-03-20转载自Ars Technica,共计866字。
转载提示:此文章非本站原创文章,若需转载请联系原作者获得转载授权。
评论(没有评论)
验证码