Google DeepMind推出AI视频配乐生成工具

101次阅读
没有评论

共计 660 个字符,预计需要花费 2 分钟才能阅读完成。

Google DeepMind 近日发布了一款新的 AI 工具,专门用于生成视频配乐。这款工具不仅可以通过文本提示生成音频,还会根据视频内容进行配乐创作。

DeepMind 指出,通过综合文本提示和视频内容,用户可以利用该工具制作出具有戏剧性配乐、逼真音效或与视频角色和基调相匹配的对话的场景。在 DeepMind 的网站上,你可以找到一些示例,这些示例的音效表现相当出色。

例如,对于一段汽车穿越赛博朋克风格城市的视频,Google 采用了“汽车打滑声、引擎加速声和电子音乐”作为提示来生成音频。另一个例子则是使用“水母在水下脉动、海洋生物、海洋”的提示来创造水下音景。

尽管用户可以选择是否使用文本提示,但 DeepMind 强调,这并非强制要求。此外,该工具能够为视频生成大量的配乐选项,让用户有更多选择。

与其他 AI 工具如 ElevenLabs 的音效生成器相比,DeepMind 的这一工具可能因其独特的视频内容考虑而脱颖而出。它还可能使与 DeepMind 的其他 AI 视频生成工具如 Veo 和 Sora 的音频配对变得更加简单。

DeepMind 在其 AI 工具上训练了视频、音频以及包含声音和口语对话详细描述的注释,这使得视频到音频的生成更加精准。

然而,该工具仍存在一些限制。例如,DeepMind 正在努力提升唇部运动与对话同步的能力,并指出视频质量对音频生成有直接影响。任何模糊或失真的视频内容都可能导致音频质量下降。

目前,该工具尚未广泛开放,仍需经过严格的安全评估和测试。一旦可用,其音频输出将带有 Google 的 SynthID 水印,以标识其为 AI 生成。

正文完
 0
admin-gah
版权声明:本文于2024-06-18转载自TheVerge,共计660字。
转载提示:此文章非本站原创文章,若需转载请联系原作者获得转载授权。
评论(没有评论)
验证码