Google DeepMind推出“纳米香蕉”模型：图像编辑新标杆解析

87次阅读

共计 658 个字符，预计需要花费 2 分钟才能阅读完成。

Google DeepMind 近日宣布，其最新开发的“纳米香蕉”模型现已免费开放使用。这一模型以其卓越的图像转换能力迅速在业界引起关注，并在 LMArena 的照片编辑模型排行榜上登顶，被誉为“全球顶级图像编辑模型”。

“纳米香蕉”模型的最大亮点在于其能够通过自然语言提示进行图像编辑，同时更好地保持图像的完整性。与传统的 AI 图像生成器不同，该模型在转换过程中能够保留主体的特征，无论是宠物还是人物，都能在编辑后看起来更像他们自己。

Google DeepMind 推出“纳米香蕉”模型：图像编辑新标杆解析

Google 建议用户通过改变服装、穿上戏服，甚至完全改变位置来测试这一功能。例如，在服装变化的过程中，编辑后的版本依然保持了人物的外观不变。虽然这些编辑功能更具娱乐性，但该模型同样适用于更实用的场景。

Google 展示了一个应用实例：将一位女士的单人照片与一只狗的短单人照片结合起来，使它们看起来像是在拥抱。这种功能类似于 Google 在其 Pixel 手机上提供的“添加我”功能，但“纳米香蕉”模型在多轮编辑方面表现更为出色。用户可以通过不断使用提示来调整同一张照片的某个元素，直到达到预期效果，例如在房间里添加不同的家具或在照片背景中添加不同的元素。

更新后的图像编辑功能现已集成到 Gemini 应用程序中。用户只需输入提示即可开始使用。与所有 Gemini 生成的图像一样，使用“纳米香蕉”模型创建或编辑的图像将带有 SynthID 数字水印，表明它们是经过 AI 修改的。

“纳米香蕉”模型的推出，不仅展示了 Google DeepMind 在 AI 图像编辑领域的技术实力，也为用户提供了更多创意和实用的图像处理工具。

正文完