共计 711 个字符,预计需要花费 2 分钟才能阅读完成。
上周,谷歌发布了一款名为 Veo 2 的新 AI 视频生成模型,这是 Veo 系列的升级版。这次的升级可谓是大跃进,Veo 2 能生成 4K 分辨率的视频,时长也更长了,感觉像是直接跳过了几个技术台阶。
谷歌在博客中详细介绍了这个新模型,称其在内部测试中表现非常出色,甚至超过了 Sora 这些老牌视频模型。他们还特别强调,Veo 2 不仅能生成高质量的视频,还能理解电影语言,比如用户可以指定镜头类型、电影效果和摄像机运动,Veo 2 就能根据这些要求生成相应的视频。举个例子,如果你输入“低角度跟踪镜头,18mm 镜头,滑过场景的中间”,Veo 2 就能理解并生成一个广角镜头效果的视频。
不过,最让我感兴趣的是,谷歌这次在安全性上也下了不少功夫。他们给生成的视频加上了 SynthID 水印,这样就能更容易区分 AI 生成的视频和真实的视频,防止被用来制作深度伪造视频。这种做法挺聪明的,毕竟现在 AI 生成的内容越来越多,如何防止滥用是个大问题。
目前,Veo 2 还只是在 Google Labs 的 VideoFX 平台上向部分创作者开放,想试试的人得先加入等待名单。不过,谷歌已经计划明年把 Veo 2 扩展到 YouTube Shorts 和其他产品上,看来他们对这个模型还是挺有信心的。
除了 Veo 2,谷歌还推出了 Imagen 3,这是一个 AI 图像生成模型,已经在 100 多个国家上线。Imagen 3 的升级也不少,比如能渲染更多样化的艺术风格,准确性和构图都有提升。据说它在写实主义、印象派、抽象和动漫这些风格上表现尤其出色。
总的来说,谷歌这次发布的 Veo 2 和 Imagen 3,感觉是在 AI 生成内容领域又迈出了一大步。虽然现在还只是在部分用户中测试,但看这势头,未来可能会成为创作者们的得力工具。