Google DeepMind推出“纳米香蕉”模型:图像编辑新标杆解析

2次阅读
没有评论

共计 658 个字符,预计需要花费 2 分钟才能阅读完成。

Google DeepMind 近日宣布,其最新开发的“纳米香蕉”模型现已免费开放使用。这一模型以其卓越的图像转换能力迅速在业界引起关注,并在 LMArena 的照片编辑模型排行榜上登顶,被誉为“全球顶级图像编辑模型”。

“纳米香蕉”模型的最大亮点在于其能够通过自然语言提示进行图像编辑,同时更好地保持图像的完整性。与传统的 AI 图像生成器不同,该模型在转换过程中能够保留主体的特征,无论是宠物还是人物,都能在编辑后看起来更像他们自己。

Google DeepMind 推出“纳米香蕉”模型:图像编辑新标杆解析

Google 建议用户通过改变服装、穿上戏服,甚至完全改变位置来测试这一功能。例如,在服装变化的过程中,编辑后的版本依然保持了人物的外观不变。虽然这些编辑功能更具娱乐性,但该模型同样适用于更实用的场景。

Google 展示了一个应用实例:将一位女士的单人照片与一只狗的短单人照片结合起来,使它们看起来像是在拥抱。这种功能类似于 Google 在其 Pixel 手机上提供的“添加我”功能,但“纳米香蕉”模型在多轮编辑方面表现更为出色。用户可以通过不断使用提示来调整同一张照片的某个元素,直到达到预期效果,例如在房间里添加不同的家具或在照片背景中添加不同的元素。

更新后的图像编辑功能现已集成到 Gemini 应用程序中。用户只需输入提示即可开始使用。与所有 Gemini 生成的图像一样,使用“纳米香蕉”模型创建或编辑的图像将带有 SynthID 数字水印,表明它们是经过 AI 修改的。

“纳米香蕉”模型的推出,不仅展示了 Google DeepMind 在 AI 图像编辑领域的技术实力,也为用户提供了更多创意和实用的图像处理工具。

正文完
 0
admin-gah
版权声明:本文于2025-08-26转载自Zdnet,共计658字。
转载提示:此文章非本站原创文章,若需转载请联系原作者获得转载授权。
评论(没有评论)
验证码