共计 528 个字符,预计需要花费 2 分钟才能阅读完成。
Google 近日为旗下 Gemini AI 推出了一项创新功能,允许用户将静态照片转化为动态视频片段。这一功能由 Google 的 Veo 3 视频模型驱动,能够将参考图像转换为八秒的视频,并同步生成 AI 音频,包括背景噪音、环境音效和语音。
该功能目前面向 Google AI Ultra 和 Pro 订阅者开放,已在特定地区的网页端上线,并计划在本周内逐步推广至移动设备。用户只需在 Gemini 的提示栏中点击“工具”选项,选择“视频”,并上传照片及描述希望如何移动的文本描述即可使用此功能。此外,用户还可以添加音频描述,用于对话、音效和环境噪音,确保音频与视觉效果完美同步。生成的视频将以 720p 分辨率和 16:9 的横向格式作为 MP4 文件提供。
Google 表示,用户可以通过动画化日常物品、让绘画作品栩栩如生或为自然场景添加动态效果来发挥创意。所有生成的视频都包含一个可见的水印,以显示它们是 AI 生成的,以及一个不可见的 SynthID 数字水印。
类似的功能已在 Google 于三月推出的生成式 AI 电影制作工具 Flow 中提供,但现在 Gemini 用户无需打开另一个应用程序即可为他们的照片制作动画。Google 还宣布,除了推出 Gemini 的新视频功能外,Flow 今天还将在额外的 75 个国家推出。