Google DeepMind与OpenAI的AGI竞赛:谁将领跑未来?

61次阅读
没有评论

共计 1171 个字符,预计需要花费 3 分钟才能阅读完成。

最近,科技圈里关于 AGI(通用人工智能)的讨论越来越热,尤其是 Google DeepMind 和 OpenAI 之间的竞争。这场竞赛有点像一场马拉松,而不是短跑。Google DeepMind 最近推出的 Veo 2 和 Imagen 3,虽然还没正式发布,但已经引起了不小的轰动。据内部消息,这些模型明年初就会通过 API 开放给开发者使用。

Veo 2 和 Imagen 3 的亮点在于它们能处理复杂的视觉效果,比如反射和阴影,生成的画面更清晰、更逼真。而且,它们还加入了 SynthID 水印,确保了内容的安全性。Google 的内部测试显示,Veo 在质量和提示遵循方面都超过了其他竞争对手,比如中国的 Kling、Meta 的 Moviegen,还有 OpenAI 的 Sora。

Google DeepMind 与 OpenAI 的 AGI 竞赛:谁将领跑未来?

a16z 的合伙人 Justine Moore 也参与了早期测试,她对 Veo 在自然和动物视频生成方面的表现赞不绝口,尤其是它能捕捉到细节的运动。这让我想起之前看过的一些 AI 生成的视频,总觉得少了点什么,但 Veo 似乎在这方面做得更好。

Veo 2 的另一个亮点是它在电影理解方面的进步。Google DeepMind 的 Tom Hume 在 X 上提到,Veo 2 提供了更逼真的视觉效果,减少了伪影,提高了细节。虽然它还不是完美的,但根据基准测试,它确实比当前最先进的模型有了显著改进。

有趣的是,Wharton 的 Ethan Mollick 认为,虽然 Sora 提供了更多的控制选项和更长的视频片段,但 Google 的 Veo 在处理复杂物理学方面仍然面临挑战。不过,他暗示中国模型的主导地位可能已经结束了。

Google 的 Veo 2 还通过了物理测试,特别是在生成体操运动员的套路时,展示了它对人类运动的改进掌握。相比之下,OpenAI 的 Sora 在这方面表现得就不那么理想了。

Veo 2 支持 4K 分辨率,能生成超过两分钟的视频,虽然目前实验平台限制为 720p 和八秒。这比 Sora 的分辨率高出四倍,视频时长是其六倍。

除了 Veo,Google DeepMind 还推出了 Genie 2,这是一个基础世界模型,能从简单的文本提示生成交互式 3D 环境。这对于训练具身 AI 代理来说非常重要,因为它提供了广泛且多样化的环境,帮助代理在各种领域中进行泛化。

回顾一下,Google 在 2014 年以 4 亿至 6.5 亿美元收购 DeepMind,这笔交易被认为是历史上最明智的商业决策之一。Elon Musk 甚至开玩笑说,其实是 DeepMind“收购”了 Google。这足以说明 AI 对 Google 的重要性,尤其是在 AGI 竞赛中。

总的来说,Google 在这场 AGI 竞赛中似乎占据了领先地位。虽然 OpenAI 的 Sora 也有其优势,但 Google 的步伐显然更快、更稳。随着更多公司以更低的价格推出功能,OpenAI 的定价策略可能会面临越来越多的挑战。不过,这场竞赛还远未结束,未来还会有更多精彩的故事发生。

正文完
 0
admin-gah
版权声明:本文于2024-12-18转载自AIM,共计1171字。
转载提示:此文章非本站原创文章,若需转载请联系原作者获得转载授权。
评论(没有评论)
验证码