共计 978 个字符,预计需要花费 3 分钟才能阅读完成。
Google 近日发布了其最新一代图像生成和编辑模型——Nano Banana Pro。这款基于 Gemini 3 Pro 构建的模型,旨在为用户提供更高质量的视觉内容创作体验。
Nano Banana Pro 不仅在推理能力和现实世界知识的应用上有所提升,还能生成更准确的视觉输出。该模型能够帮助用户从各种创意素材中生成视觉效果,包括想法、原型、笔记和实时信息,并且可以访问 Google 搜索的知识库。
“Nano Banana Pro 不仅仅是生成图像,它还能帮助用户创建有用的内容,”Google 表示。用户可以利用该模型生成信息图表、示意图、食谱或快照等基于事实的信息。
此外,Nano Banana Pro 在多种语言中的文本渲染准确性和可读性上也有所提升,支持更长的文本、风格化字体、模型和本地化内容。Google 还强调,该模型在混合多个元素时的一致性有所改进,能够组合多达 14 张图像,并保持最多五个人的相似性。
升级后的系统为创作者提供了新的控制功能,包括本地化编辑、相机角度调整、光线变化和景深修改。用户还可以以多种宽高比和分辨率(包括 2K 和 4K)导出创作内容。
Nano Banana Pro 将在 Google 的消费级和专业级产品中推出。在 Gemini 应用中,该模型出现在图像创建中的“Thinking”选项下。免费用户将获得有限访问权限,之后将恢复为原始 Nano Banana。AI Plus、Pro 和 Ultra 订阅用户将获得更高的配额。在搜索的 AI 模式中,该模型在美国为 Google AI Pro 和 Ultra 用户提供。
对于专业人士,该模型将集成到 Google Ads、Workspace 工具(如 Slides 和 Vids)以及电影制作的 Flow 中。开发者可以通过 Gemini API、Google AI Studio、Antigravity 和 Vertex AI 访问该模型。
Google 还宣布了验证 AI 生成内容的新方法。所有由 Google 工具生成的图像将继续包含 SynthID 水印。用户现在可以在 Gemini 应用中上传图像,并根据 SynthID 信号“询问它是否由 Google AI 生成”。免费和 Pro 级别的图像还将包含可见的 Gemini 水印,Ultra 订阅用户和 Google AI Studio 开发者将移除该水印。
Google 表示,其目标是支持透明度。“我们认为,知道图像是否由 AI 生成至关重要,”Google 表示。