Google DeepMind推出“纳米香蕉”AI模型，革新Gemini图像编辑体验

84次阅读

共计 619 个字符，预计需要花费 2 分钟才能阅读完成。

Google DeepMind 近日宣布，他们开发了一款名为“纳米香蕉”的高性能照片编辑 AI 模型，该模型现已集成到 Gemini 应用中，并可从今天起免费访问。这款模型以其出色的图像转换能力，迅速在 LMArena 的照片编辑模型排行榜上占据榜首，并被誉为“全球顶级图像编辑模型”。

“纳米香蕉”模型的核心功能在于它能够通过自然语言提示来编辑图片，同时保持图像的本质不变。这意味着用户在尝试将照片转换为水彩画或动漫风格时，不再需要担心主体特征在转换过程中丢失。Google 建议用户可以通过改变服装、穿上戏服，甚至完全改变位置来测试这一功能。如示例 GIF 所示，编辑后的版本在服装变化中保持了人物的外观不变。

Google DeepMind 推出“纳米香蕉”AI 模型，革新 Gemini 图像编辑体验

此外，该模型还支持多轮编辑功能，用户可以不断使用提示来调整同一张照片的某个元素，直到获得预期的结果。例如，用户可以在房间中添加不同的家具，或在照片背景中添加不同的元素。同时，用户还可以将一张照片的元素（如颜色）应用到新图像中，甚至将两张不同照片的元素混合在一起，创建一张新照片。Google 分享了一个例子，将一位女性的单人照片与一只狗的单人照片结合起来，使它们看起来像是在拥抱。

从今天起，更新后的图像编辑功能已在 Gemini 应用中提供。用户只需输入提示即可开始使用。与所有 Gemini 生成的图像一样，使用此更新模型创建或编辑的图像将带有 SynthID 数字水印，表明它们是经过 AI 修改的。这一功能的推出，无疑将为用户带来更加丰富和便捷的照片编辑体验。

正文完