Google 与 OpenAI 生成式 AI 视频竞争升级：Veo 3.1 与 Sora 2 谁更胜一筹？

82次阅读

共计 1072 个字符，预计需要花费 3 分钟才能阅读完成。

Google 与 OpenAI 在生成式 AI 视频领域的竞争再次升级。Google DeepMind 近日发布了其生成视频模型 Veo 的最新版本 Veo 3.1，并对其 AI 电影制作工具 Flow 进行了功能扩展。这一更新恰逢 OpenAI 推出其最新视频和音频生成模型 Sora 2，两家科技巨头在生成式 AI 领域的较量愈发激烈。

Veo 3.1 的发布标志着 Google 在生成式 AI 视频技术上的又一次重大突破。该版本基于 Veo 3 模型，在叙事控制和真实性方面均有显著提升，特别是在图像转换为视频时的提示遵从性和视听质量上取得了改进。目前，Veo 3.1 已与 Flow 集成，并通过 Gemini API、Vertex AI 和 Gemini 应用程序提供使用。

Google DeepMind 表示，自五个月前推出由 Veo 提供支持的 AI 电影制作工具 Flow 以来，该工具已经生成了超过 2.75 亿个视频，展现了其在激发创造力方面的巨大潜力。此次更新为 Flow 带来了多项新功能，包括音频生成、新的编辑选项以及对视频创作的更大控制。

具体而言，Veo 3.1 为现有的 Flow 工具（如 Ingredients to Video、Frames to Video 和 Extend）增加了音频支持，使创作者能够生成带有同步声音的视频。通过 Ingredients to Video，用户可以使用多个参考图像控制场景的外观；Frames to Video 允许用户在两个静态图像之间生成平滑的过渡；而 Extend 则允许创建基于先前片段的更长的连续镜头。

此外，Flow 还引入了新的编辑工具。Insert 功能使用户能够将新元素（如角色或对象）添加到场景中，而即将推出的 Remove 功能将允许无缝删除不需要的对象。Google 表示，Flow 现在可以处理复杂的细节，如阴影和场景照明，使添加和删除看起来更加自然。

值得注意的是，Veo 3.1 的发布仅在 OpenAI 推出其最新的视频和音频生成模型 Sora 2 几天后。Sora 2 不仅是一款强大的生成式 AI 模型，还附带了一款名为 Sora 的社交 iOS 应用程序，允许用户创建、混音并将自己插入生成的视频中。这一举动被视为 OpenAI 在社交视频领域的一次重要尝试，旨在挑战 TikTok 和 Instagram 等现有平台。

随着 Veo 3.1 和 Sora 2 的相继发布，Google 和 OpenAI 在生成式 AI 视频领域的竞争进入白热化阶段。两家公司都在不断推动技术的边界，试图在创意产业中占据主导地位。然而，这些功能仍在开发中，未来将根据用户反馈进一步优化。这场科技巨头的较量，不仅将影响生成式 AI 技术的发展方向，也可能重塑整个创意产业的格局。

正文完