DeepMind发布Genie 3：AI技术如何改变3D世界生成？

106次阅读

共计 387 个字符，预计需要花费 1 分钟才能阅读完成。

DeepMind 发布 Genie 3：AI 技术如何改变 3D 世界生成？

去年 12 月，一篇关于初创公司 World Labs 的文章提到，该公司可以从单张图像生成 3D 世界。然而，这一领域的竞争并非仅限于初创公司。谷歌的 DeepMind AI 部门近日发布了其最新的“通用世界模型”——Genie 3。

DeepMind 在其公告中解释：“在给定文本提示的情况下，Genie 3 可以生成动态世界，用户可以实时导航，帧率达到每秒 24 帧，并在 720p 分辨率下保持几分钟的一致性。”这里的“一致性”意味着物体和场景在用户视线离开后仍能保持原位。这项技术不仅适用于游戏领域，还可能应用于教育和……音乐？创意艺术家们将如何利用这种技术，令人期待。

然而，DeepMind 对这些“世界模型”的长期计划更为宏大：“这是通往 AGI（人工通用智能）的关键一步，因为它们使得在丰富的模拟环境中训练 AI 代理成为可能。”AGI，即人工通用智能，指的是 AI 能够理解或学习人类可以完成的一系列任务。

DeepMind 发布 Genie 3：AI 技术如何改变 3D 世界生成？