谷歌Veo 3为何偏爱“爸爸笑话”？揭秘AI视频生成新趋势

155次阅读

共计 1081 个字符，预计需要花费 3 分钟才能阅读完成。

谷歌最新的 AI 突破——Veo 3，承诺将简单的文本提示转化为高清的 8 秒视频，并包含原生音频，如环境音、对话甚至动物声音。尽管这家科技巨头在推销其真实感和物理准确性，但真正引起意外关注的是它不断重复同一个“爸爸笑话”的倾向。

谷歌 Veo 3 为何偏爱“爸爸笑话”？揭秘 AI 视频生成新趋势

本周早些时候发布的 Veo 3，是快速发展的 AI 视频生成领域中的最新一击，OpenAI 的 Sora 和其他 AI 视频生成器也在争夺主导地位。然而，大多数竞争对手止步于视觉效果，而谷歌的产品更进一步，生成了与唇部动作和现实物理同步的音频。

据谷歌 DeepMind 产品副总裁 Eli Collins 介绍，Veo 3 在从文本到视频的真实感、精确的唇部同步等多个方面表现出色。该模型目前在美国通过两种途径提供：谷歌的 Ultra AI 计划，每月 249.99 美元，面向创意专业人士和 AI 超级用户；以及通过其企业级平台 Vertex AI。

然而，Veo 3 输出的一个奇特现象浮出水面。无论提示是什么，用户发现该工具反复生成同一个“爸爸笑话”：“你会怎么称呼一只会变魔术的狗？拉布拉卡达布拉？不，是西施魔术师。”这种一致性至少令人困惑。正如 404 Media 本周指出的那样，当 Veo 3 被要求讲笑话时，“西施犬”这一行经常出现。

虽然没有明确迹象表明这个笑话的实际来源，但它已在互联网上流传多年，其真实起源难以追溯。不过，这个笑话的反复出现确实引发了关于谷歌训练数据的问题。今年 3 月，Reddit 在其 S - 1 文件中透露，谷歌已签署了一份每年 6000 万美元的许可协议，以访问 Reddit 的帖子档案，作为 AI 模型的训练素材。

Reddit 称用户内容为“对话数据和知识的宝贵来源”。它还确认计划继续将其数据授权给其他第三方，并在其广告产品中使用更多 AI。路透社当时报道的这项内容交易，可能有助于解释“爸爸笑话”如何成为 Veo 3 神经词汇的一部分。不过，公平地说，鉴于这个笑话的普遍性，它可能几乎起源于任何地方。

除了值得成为表情包的奇特性外，Veo 3 可能对内容创作者和广告商产生重大影响。对于代理机构和品牌，尤其是那些在 TikTok、Instagram Reels 或 YouTube Shorts 等短格式或绩效驱动领域运营的机构，该工具可能会为创意输出解锁新的效率。

还有可能使用像 Veo 3 这样的 AI 模型在大规模生产之前预可视化广告活动概念，或使用生成变体在市场上进行不同广告叙事的 A / B 测试。但任何广泛采用都可能取决于该模型是否能被信任，不会在商业作品中插入未经脚本的“爸爸笑话”。

目前，Veo 3 仅对美国用户开放，尽管谷歌尚未宣布在澳大利亚的推出日期，但如果过去的发布有任何迹象，国际访问可能会在几个月内跟进。

正文完