Google Veo 3 视频生成模型：高端AI视频工具的新选择

130次阅读

共计 830 个字符，预计需要花费 3 分钟才能阅读完成。

Google Veo 3 视频生成模型：高端 AI 视频工具的新选择

Google 的 Veo 3 视频生成模型现已通过 Gemini API 提供，其价格使其成为 AI 视频领域较为昂贵的选择之一。

Gemini API 的集成面向那些希望将高级视频生成功能引入其应用程序或构建生产级原型的开发者。目前，该 API 仅限于文本到视频的转换，但图像到视频的支持——已在 Gemini 应用中上线——即将到来。Veo 3 是 Google 首个能够通过单一文本提示生成高分辨率视频和同步音频的模型。它能够同时生成视觉效果、对话、音乐和音效。

为了帮助开发者快速上手，Google AI Studio 提供了一个 SDK 模板和一个用于快速原型设计的启动应用。访问需要启用计费的活跃 Google Cloud 项目。Google 表示，Veo 3 已经在 Gemini 应用、Flow 和 Vertex AI 中被使用了数百万次。

通过 Gemini API 访问 Veo 3 仅在 Google Cloud 的付费层级中提供。价格为每秒钟 0.75 美元，生成 720p、24fps、16:9 格式的带音频视频——比 Veo 2 贵 25 美分，后者不包括音频。Google 还宣布了“Veo 3 Fast”模式，该模式更快且更便宜，但尚未在 API 中提供。

按当前价格计算，一个八秒的视频成本为 6 美元，一个五分钟的视频成本为 225 美元。由于生成完美结果通常需要多次尝试，成本可能会迅速上升。例如，如果需要十倍于最终成片的素材来生成五分钟可用的视频，总成本可能达到 2250 美元。尽管如此，Google 可能认为在某些使用场景下，这可能比传统视频制作更便宜。

Google 表示，Cartwheel 使用 Veo 3 将 2D 视频转换为逼真的 3D 角色动画，将生成的动作用于客户项目的绑定模型上。

游戏工作室 Volley 使用 Veo 3 为其角色扮演游戏 “Wit’s End” 创建过场动画，使开发者能够快速尝试新的故事创意和视觉效果。到目前为止，这些案例指向相当专业化的使用场景，这可能表明 Google 尚未有更大的集成案例可供展示。也有可能一些公司在幕后使用 Veo 3，但尚未准备好公开。

正文完