Google DeepMind推出AI视频配乐生成工具

233次阅读

共计 660 个字符，预计需要花费 2 分钟才能阅读完成。

Google DeepMind 近日发布了一款新的 AI 工具，专门用于生成视频配乐。这款工具不仅可以通过文本提示生成音频，还会根据视频内容进行配乐创作。

DeepMind 指出，通过综合文本提示和视频内容，用户可以利用该工具制作出具有戏剧性配乐、逼真音效或与视频角色和基调相匹配的对话的场景。在 DeepMind 的网站上，你可以找到一些示例，这些示例的音效表现相当出色。

例如，对于一段汽车穿越赛博朋克风格城市的视频，Google 采用了“汽车打滑声、引擎加速声和电子音乐”作为提示来生成音频。另一个例子则是使用“水母在水下脉动、海洋生物、海洋”的提示来创造水下音景。

尽管用户可以选择是否使用文本提示，但 DeepMind 强调，这并非强制要求。此外，该工具能够为视频生成大量的配乐选项，让用户有更多选择。

与其他 AI 工具如 ElevenLabs 的音效生成器相比，DeepMind 的这一工具可能因其独特的视频内容考虑而脱颖而出。它还可能使与 DeepMind 的其他 AI 视频生成工具如 Veo 和 Sora 的音频配对变得更加简单。

DeepMind 在其 AI 工具上训练了视频、音频以及包含声音和口语对话详细描述的注释，这使得视频到音频的生成更加精准。

然而，该工具仍存在一些限制。例如，DeepMind 正在努力提升唇部运动与对话同步的能力，并指出视频质量对音频生成有直接影响。任何模糊或失真的视频内容都可能导致音频质量下降。

目前，该工具尚未广泛开放，仍需经过严格的安全评估和测试。一旦可用，其音频输出将带有 Google 的 SynthID 水印，以标识其为 AI 生成。

正文完

发表至： AI行业动态

2024-06-18 23:34

0

转载提示：此文章非本站原创文章，若需转载请联系原作者获得转载授权。

Decagon利用生成式AI革新客户支持服务

国内高校严查AI作弊，学术诚信面临新挑战