共计 387 个字符,预计需要花费 1 分钟才能阅读完成。
去年 12 月,一篇关于初创公司 World Labs 的文章提到,该公司可以从单张图像生成 3D 世界。然而,这一领域的竞争并非仅限于初创公司。谷歌的 DeepMind AI 部门近日发布了其最新的“通用世界模型”——Genie 3。
DeepMind 在其公告中解释:“在给定文本提示的情况下,Genie 3 可以生成动态世界,用户可以实时导航,帧率达到每秒 24 帧,并在 720p 分辨率下保持几分钟的一致性。”这里的“一致性”意味着物体和场景在用户视线离开后仍能保持原位。这项技术不仅适用于游戏领域,还可能应用于教育和……音乐?创意艺术家们将如何利用这种技术,令人期待。
然而,DeepMind 对这些“世界模型”的长期计划更为宏大:“这是通往 AGI(人工通用智能)的关键一步,因为它们使得在丰富的模拟环境中训练 AI 代理成为可能。”AGI,即人工通用智能,指的是 AI 能够理解或学习人类可以完成的一系列任务。
正文完