Google 与 OpenAI 生成式 AI 视频竞争升级:Veo 3.1 与 Sora 2 谁更胜一筹?

2次阅读
没有评论

共计 1072 个字符,预计需要花费 3 分钟才能阅读完成。

Google 与 OpenAI 在生成式 AI 视频领域的竞争再次升级。Google DeepMind 近日发布了其生成视频模型 Veo 的最新版本 Veo 3.1,并对其 AI 电影制作工具 Flow 进行了功能扩展。这一更新恰逢 OpenAI 推出其最新视频和音频生成模型 Sora 2,两家科技巨头在生成式 AI 领域的较量愈发激烈。

Veo 3.1 的发布标志着 Google 在生成式 AI 视频技术上的又一次重大突破。该版本基于 Veo 3 模型,在叙事控制和真实性方面均有显著提升,特别是在图像转换为视频时的提示遵从性和视听质量上取得了改进。目前,Veo 3.1 已与 Flow 集成,并通过 Gemini API、Vertex AI 和 Gemini 应用程序提供使用。

Google 与 OpenAI 生成式 AI 视频竞争升级:Veo 3.1 与 Sora 2 谁更胜一筹?

Google DeepMind 表示,自五个月前推出由 Veo 提供支持的 AI 电影制作工具 Flow 以来,该工具已经生成了超过 2.75 亿个视频,展现了其在激发创造力方面的巨大潜力。此次更新为 Flow 带来了多项新功能,包括音频生成、新的编辑选项以及对视频创作的更大控制。

具体而言,Veo 3.1 为现有的 Flow 工具(如 Ingredients to Video、Frames to Video 和 Extend)增加了音频支持,使创作者能够生成带有同步声音的视频。通过 Ingredients to Video,用户可以使用多个参考图像控制场景的外观;Frames to Video 允许用户在两个静态图像之间生成平滑的过渡;而 Extend 则允许创建基于先前片段的更长的连续镜头。

此外,Flow 还引入了新的编辑工具。Insert 功能使用户能够将新元素(如角色或对象)添加到场景中,而即将推出的 Remove 功能将允许无缝删除不需要的对象。Google 表示,Flow 现在可以处理复杂的细节,如阴影和场景照明,使添加和删除看起来更加自然。

值得注意的是,Veo 3.1 的发布仅在 OpenAI 推出其最新的视频和音频生成模型 Sora 2 几天后。Sora 2 不仅是一款强大的生成式 AI 模型,还附带了一款名为 Sora 的社交 iOS 应用程序,允许用户创建、混音并将自己插入生成的视频中。这一举动被视为 OpenAI 在社交视频领域的一次重要尝试,旨在挑战 TikTok 和 Instagram 等现有平台。

随着 Veo 3.1 和 Sora 2 的相继发布,Google 和 OpenAI 在生成式 AI 视频领域的竞争进入白热化阶段。两家公司都在不断推动技术的边界,试图在创意产业中占据主导地位。然而,这些功能仍在开发中,未来将根据用户反馈进一步优化。这场科技巨头的较量,不仅将影响生成式 AI 技术的发展方向,也可能重塑整个创意产业的格局。

正文完
 0
admin-gah
版权声明:本文于2025-10-17转载自Analytics India Magazine,共计1072字。
转载提示:此文章非本站原创文章,若需转载请联系原作者获得转载授权。
评论(没有评论)
验证码