共计 820 个字符,预计需要花费 3 分钟才能阅读完成。
人工智能领域正迎来激动人心的变革。近日,Google DeepMind 正式推出了名为 Project Genie 的实验性研究原型。这一项目基于前沿的世界模型人工智能技术,能够生成并供用户探索交互式虚拟环境,标志着 AI 正从生成静态内容迈向构建动态“世界”的新阶段。

什么是 Project Genie?
Project Genie 的核心驱动引擎是 Genie 3,这是一个通用世界模型。它能够根据简单的文本与图像提示,创造出多样且可供探索的动态世界。用户可以生成实时演变的景观、角色及场景,其中的交互元素会对用户的移动与操作做出即时响应,带来了前所未有的沉浸式体验。
世界模型的技术突破
Genie 3 最初于 2025 年亮相,作为一种突破性的“世界模型”,它能够构建在数分钟探索过程中保持逻辑连贯性与连续性的交互环境。这超越了早期只能生成短暂、孤立场景的系统,是迈向更通用人工智能形式的关键一步。
这一原型是 Google 在高级人工智能系统研究中的重要部分。其模拟范围广泛,既包括沙漠、森林等自然场景,也可生成复杂的生态系统或奇幻世界,所有内容均由用户描述驱动生成。
行业竞争与空间智能
Project Genie 的发布正值生成式人工智能竞争白热化之际。OpenAI 与 Meta 等公司也在积极研发支持动态内容创建的系统。研究界普遍认为,如 Genie 这样的世界模型,将使 AI 能够在模拟环境中进行学习与推理。
与此同时,整个人工智能行业正更广泛地推动“空间智能”的发展。这一技术类别强调 AI 理解并生成三维环境的能力。此前,World Labs 公司推出了名为 Marble 的多模态世界模型,可从文本、图像、视频或草图中生成可导航的 3D 场景,也体现了对传统语言与图像模型的超越。
如何体验 Project Genie
目前,Google 已向美国地区的 Google AI Ultra 订阅用户开放 Project Genie 的体验权限,允许他们试用其世界生成功能。这为开发者和研究者提供了先行探索这一前沿技术的机会。