共计 1081 个字符,预计需要花费 3 分钟才能阅读完成。
谷歌最新的 AI 突破——Veo 3,承诺将简单的文本提示转化为高清的 8 秒视频,并包含原生音频,如环境音、对话甚至动物声音。尽管这家科技巨头在推销其真实感和物理准确性,但真正引起意外关注的是它不断重复同一个“爸爸笑话”的倾向。
本周早些时候发布的 Veo 3,是快速发展的 AI 视频生成领域中的最新一击,OpenAI 的 Sora 和其他 AI 视频生成器也在争夺主导地位。然而,大多数竞争对手止步于视觉效果,而谷歌的产品更进一步,生成了与唇部动作和现实物理同步的音频。
据谷歌 DeepMind 产品副总裁 Eli Collins 介绍,Veo 3 在从文本到视频的真实感、精确的唇部同步等多个方面表现出色。该模型目前在美国通过两种途径提供:谷歌的 Ultra AI 计划,每月 249.99 美元,面向创意专业人士和 AI 超级用户;以及通过其企业级平台 Vertex AI。
然而,Veo 3 输出的一个奇特现象浮出水面。无论提示是什么,用户发现该工具反复生成同一个“爸爸笑话”:“你会怎么称呼一只会变魔术的狗?拉布拉卡达布拉?不,是西施魔术师。”这种一致性至少令人困惑。正如 404 Media 本周指出的那样,当 Veo 3 被要求讲笑话时,“西施犬”这一行经常出现。
虽然没有明确迹象表明这个笑话的实际来源,但它已在互联网上流传多年,其真实起源难以追溯。不过,这个笑话的反复出现确实引发了关于谷歌训练数据的问题。今年 3 月,Reddit 在其 S - 1 文件中透露,谷歌已签署了一份每年 6000 万美元的许可协议,以访问 Reddit 的帖子档案,作为 AI 模型的训练素材。
Reddit 称用户内容为“对话数据和知识的宝贵来源”。它还确认计划继续将其数据授权给其他第三方,并在其广告产品中使用更多 AI。路透社当时报道的这项内容交易,可能有助于解释“爸爸笑话”如何成为 Veo 3 神经词汇的一部分。不过,公平地说,鉴于这个笑话的普遍性,它可能几乎起源于任何地方。
除了值得成为表情包的奇特性外,Veo 3 可能对内容创作者和广告商产生重大影响。对于代理机构和品牌,尤其是那些在 TikTok、Instagram Reels 或 YouTube Shorts 等短格式或绩效驱动领域运营的机构,该工具可能会为创意输出解锁新的效率。
还有可能使用像 Veo 3 这样的 AI 模型在大规模生产之前预可视化广告活动概念,或使用生成变体在市场上进行不同广告叙事的 A / B 测试。但任何广泛采用都可能取决于该模型是否能被信任,不会在商业作品中插入未经脚本的“爸爸笑话”。
目前,Veo 3 仅对美国用户开放,尽管谷歌尚未宣布在澳大利亚的推出日期,但如果过去的发布有任何迹象,国际访问可能会在几个月内跟进。