Google DeepMind与OpenAI的AGI竞赛：谁将领跑未来？

182次阅读

共计 1171 个字符，预计需要花费 3 分钟才能阅读完成。

最近，科技圈里关于 AGI（通用人工智能）的讨论越来越热，尤其是 Google DeepMind 和 OpenAI 之间的竞争。这场竞赛有点像一场马拉松，而不是短跑。Google DeepMind 最近推出的 Veo 2 和 Imagen 3，虽然还没正式发布，但已经引起了不小的轰动。据内部消息，这些模型明年初就会通过 API 开放给开发者使用。

Veo 2 和 Imagen 3 的亮点在于它们能处理复杂的视觉效果，比如反射和阴影，生成的画面更清晰、更逼真。而且，它们还加入了 SynthID 水印，确保了内容的安全性。Google 的内部测试显示，Veo 在质量和提示遵循方面都超过了其他竞争对手，比如中国的 Kling、Meta 的 Moviegen，还有 OpenAI 的 Sora。

Google DeepMind 与 OpenAI 的 AGI 竞赛：谁将领跑未来？

a16z 的合伙人 Justine Moore 也参与了早期测试，她对 Veo 在自然和动物视频生成方面的表现赞不绝口，尤其是它能捕捉到细节的运动。这让我想起之前看过的一些 AI 生成的视频，总觉得少了点什么，但 Veo 似乎在这方面做得更好。

Veo 2 的另一个亮点是它在电影理解方面的进步。Google DeepMind 的 Tom Hume 在 X 上提到，Veo 2 提供了更逼真的视觉效果，减少了伪影，提高了细节。虽然它还不是完美的，但根据基准测试，它确实比当前最先进的模型有了显著改进。

有趣的是，Wharton 的 Ethan Mollick 认为，虽然 Sora 提供了更多的控制选项和更长的视频片段，但 Google 的 Veo 在处理复杂物理学方面仍然面临挑战。不过，他暗示中国模型的主导地位可能已经结束了。

Google 的 Veo 2 还通过了物理测试，特别是在生成体操运动员的套路时，展示了它对人类运动的改进掌握。相比之下，OpenAI 的 Sora 在这方面表现得就不那么理想了。

Veo 2 支持 4K 分辨率，能生成超过两分钟的视频，虽然目前实验平台限制为 720p 和八秒。这比 Sora 的分辨率高出四倍，视频时长是其六倍。

除了 Veo，Google DeepMind 还推出了 Genie 2，这是一个基础世界模型，能从简单的文本提示生成交互式 3D 环境。这对于训练具身 AI 代理来说非常重要，因为它提供了广泛且多样化的环境，帮助代理在各种领域中进行泛化。

回顾一下，Google 在 2014 年以 4 亿至 6.5 亿美元收购 DeepMind，这笔交易被认为是历史上最明智的商业决策之一。Elon Musk 甚至开玩笑说，其实是 DeepMind“收购”了 Google。这足以说明 AI 对 Google 的重要性，尤其是在 AGI 竞赛中。

总的来说，Google 在这场 AGI 竞赛中似乎占据了领先地位。虽然 OpenAI 的 Sora 也有其优势，但 Google 的步伐显然更快、更稳。随着更多公司以更低的价格推出功能，OpenAI 的定价策略可能会面临越来越多的挑战。不过，这场竞赛还远未结束，未来还会有更多精彩的故事发生。

正文完

AGI Google DeepMind Imagen 3 OpenAI Veo 2

发表至： AI行业动态

2024-12-18 02:13

0

版权声明：本文于2024-12-18转载自AIM，共计1171字。

转载提示：此文章非本站原创文章，若需转载请联系原作者获得转载授权。

Vision Pro首部剧本化沉浸式电影本周上映，预告片在此

联发科天玑 9500 芯片发布：安卓手机 AI 性能新标杆

新光学存储技术突破：CD或将重新焕发生机

DeepSeek突破AI大模型训练成本难题，为发展中国家带来新机遇

YouTube推出新功能：创作者可选择AI训练内容使用

Amazon Nova AI模型：AI领域的革命性突破还是噱头？

评论（没有评论）

验证码

最新文章