共计 619 个字符,预计需要花费 2 分钟才能阅读完成。
Google DeepMind 近日宣布,他们开发了一款名为“纳米香蕉”的高性能照片编辑 AI 模型,该模型现已集成到 Gemini 应用中,并可从今天起免费访问。这款模型以其出色的图像转换能力,迅速在 LMArena 的照片编辑模型排行榜上占据榜首,并被誉为“全球顶级图像编辑模型”。
“纳米香蕉”模型的核心功能在于它能够通过自然语言提示来编辑图片,同时保持图像的本质不变。这意味着用户在尝试将照片转换为水彩画或动漫风格时,不再需要担心主体特征在转换过程中丢失。Google 建议用户可以通过改变服装、穿上戏服,甚至完全改变位置来测试这一功能。如示例 GIF 所示,编辑后的版本在服装变化中保持了人物的外观不变。
此外,该模型还支持多轮编辑功能,用户可以不断使用提示来调整同一张照片的某个元素,直到获得预期的结果。例如,用户可以在房间中添加不同的家具,或在照片背景中添加不同的元素。同时,用户还可以将一张照片的元素(如颜色)应用到新图像中,甚至将两张不同照片的元素混合在一起,创建一张新照片。Google 分享了一个例子,将一位女性的单人照片与一只狗的单人照片结合起来,使它们看起来像是在拥抱。
从今天起,更新后的图像编辑功能已在 Gemini 应用中提供。用户只需输入提示即可开始使用。与所有 Gemini 生成的图像一样,使用此更新模型创建或编辑的图像将带有 SynthID 数字水印,表明它们是经过 AI 修改的。这一功能的推出,无疑将为用户带来更加丰富和便捷的照片编辑体验。