Google Veo 3:从单张图片生成8秒视频的AI黑科技

4次阅读
没有评论

共计 798 个字符,预计需要花费 2 分钟才能阅读完成。

AI 生成的视频正在突破技术界限,Google 最新推出的 Veo 3 视频生成 AI 模型就是最好的证明。这款创新工具现在可以从单张静态图像生成包含 AI 生成音频的 8 秒视频片段,为创意产业带来了全新的可能性。

根据 Google Cloud 最新文档显示,Veo 3 的图像到视频功能目前以 ’ 预览版 ’ 形式提供。Google Labs 和 Gemini 应用负责人 Josh Woodward 在 X 平台上透露,公司正在积极推进这一功能的开发。

Google Veo 3:从单张图片生成 8 秒视频的 AI 黑科技

Veo 3 的实际应用场景十分广泛。例如,社交媒体网红可以上传个人头像,让 AI 生成一段展示合作品牌产品的 T 台走秀视频。模型会自动添加环境音效,如人群低语和脚步声,甚至可以让 AI 形象进行语音表达。

对于品牌而言,Veo 3 同样具有巨大价值。企业可以通过提供产品图像,让 AI 生成多角度展示视频。这一创新功能不仅能够节省传统视频拍摄的时间和成本,还能为社交媒体营销提供丰富的创意素材。

Google 在今年 5 月的 I / O 开发者大会上首次展示了 Veo 3。该模型以其出色的 AI 生成视频和音频集成能力,在 AI 研究界和创意产业引起了广泛关注。其逼真的物理效果模拟能力,以及克服了早期 AI 视频生成工具的技术缺陷,都让人印象深刻。

目前,Veo 3 已作为公共预览版在 159 个国家 / 地区发布,所有 Google Cloud 客户和合作伙伴都可以通过 Vertex AI Media Studio 访问这一工具。

然而,Veo 3 的推出也引发了一些争议。人们担心它可能加剧网络虚假信息的传播,以及社交媒体操纵的风险。关于模型训练数据的来源也引发了讨论,Google DeepMind CEO Demis Hassabis 曾暗示可能使用了 YouTube 视频。

随着 AI 公司大量使用互联网数据进行模型训练,来自出版、艺术和电影行业的创作者对版权问题提出了质疑。对于更注重数据合规性的用户,Moonvalley 的 Marey 可能是一个替代选择,它声称仅使用许可数据进行训练。

正文完
 0
admin-gah
版权声明:本文于2025-07-10转载自Zdnet,共计798字。
转载提示:此文章非本站原创文章,若需转载请联系原作者获得转载授权。
评论(没有评论)
验证码