代码设定边界AI填充世界,新框架如何为智能体创造无限宇宙?

23次阅读
没有评论

共计 1965 个字符,预计需要花费 5 分钟才能阅读完成。

想象一个虚拟世界:你可以推开任何一扇门,与任何 NPC 对话,探索任何角落——但无论你如何尝试,都无法穿过上锁的门,也无法花掉不属于你的钱。这个世界既拥有生成式 AI 的无限创意,又保持着电子游戏般的严格规则。这正是普林斯顿大学、加州大学洛杉矶分校和宾夕法尼亚大学的研究团队提出的新范式。

他们开发了一种名为“网页世界模型”(Web World Models)的方法,旨在为 AI 智能体构建稳定、可扩展且逻辑自洽的持久探索环境。其核心在于一个巧妙的双层架构:底层用标准网页代码(TypeScript)定义不可违背的规则与逻辑,上层则由大语言模型(LLM)负责填充故事、描述与细节。

 代码设定边界 AI 填充世界,新框架如何为智能体创造无限宇宙?

传统上,构建虚拟世界面临两难:基于数据库的网页应用逻辑严谨、完全可控,但内容固定、上下文有限;而纯生成式世界模型(如某些 AI 游戏引擎)能创造丰富多样的内容,却难以保证一致性,容易“失控”。网页世界模型试图融合二者之长,为 AI 智能体训练提供新思路。,

双层架构:代码为骨,AI 为肉

该模型的第一层是纯粹的代码层。研究人员使用 TypeScript 明确定义了世界中存在什么实体、实体间如何连接、以及允许执行哪些动作。这一层充当了“世界宪法”的角色,强制执行最基本的逻辑一致性。例如,代码会规定一扇门是否上锁、一件物品是否可被拾取、一次交易是否需要足够的货币。任何行动都必须先通过代码层的逻辑校验。

第二层则交由大语言模型驱动。在代码许可的范围内,LLM 负责让世界“活”起来:生成环境的文字描述、构思非玩家角色(NPC)的对话、渲染美学细节。关键在于,LLM 的创造力被严格限制在代码设定的“牢笼”内。当玩家尝试一个动作时,系统会首先运行代码检查其合法性,只有通过后,才会召唤 AI 来叙述“发生了什么”。这意味着,无论语言模型多么天马行空,都无法让玩家做出代码禁止的事情,从而保障了虚拟世界的稳定性和可控性。,

哈希函数:无需存储的“无限”宇宙

构建一个近乎无限的、可持久访问的虚拟世界,如何解决海量数据存储问题?研究团队采用了一个巧妙的方案:他们根本不存储具体世界内容,而是根据需要实时生成。

其秘诀在于一个确定性函数(哈希函数)。每个地点(例如一个星球)都由一组唯一的坐标标识。当玩家访问时,系统将这组坐标输入哈希函数,得到一个固定的“种子”。这个种子用于初始化语言模型的生成参数,确保 每次根据相同坐标生成的世界内容完全一致。玩家离开后再返回,看到的将是同一个星球,这不是因为数据被保存了,而是因为相同的数学计算总是产生相同的结果。研究人员称之为“无存储成本的对象恒存性”。

该系统还具备鲁棒性设计。如果语言模型响应缓慢或崩溃,系统会自动回退到预制的模板描述。世界会失去丰富性,但底层规则依然有效,应用程序不会瘫痪。这使其区别于完全依赖生成式 AI 的系统,为 AI 智能体提供了更可靠的训练环境。,

从星际旅行到卡牌游戏:七项概念验证

为了展示该框架的通用性,团队构建了七个演示应用:,

  • 无限旅行图集:将地球变成一个可交互式探索的球体。点击任意地点,系统会基于真实地理坐标(代码层)生成该地的描述、旅行路线和相关故事(LLM 层)。
  • 银河旅行图集:为科幻宇宙构建类似系统。代码层按规则生成星系、恒星和行星;LLM 层则添加任务、角色和教育内容。
  • AI Spire(卡牌游戏):玩家可以用自然语言请求自定义卡牌(如“一个能造成大量火焰伤害但同时冻结对手的火球”)。LLM 生成卡牌概念后,代码层会进行模式验证,确保其符合游戏规则(如费用、类型限制),然后才由游戏引擎实现效果。
  • AI Alchemy(沙盒模拟):元素相互作用,AI 会建议新的反应规则。
  • Cosmic Voyager(3D 行星探索器):探索行星时伴有持续的 AI 生成解说。
  • WWMPedia:生成维基百科风格的文章。
  • Bookshelf:用于生成长篇文学作品的系统。

对 AI 智能体训练的意义与未解之谜

研究人员将其工作定位为介于僵化数据库与不可控生成模型之间的“第三条道路”。它结合了经典软件工程的可靠性与大语言模型的灵活性,为训练 AI 智能体提供了潜在的理想沙盒。自主智能体需要在学习环境中进行试错,这种环境必须足够一致,以便智能体总结规律;同时又需足够灵活,以应对未见过的情景。网页世界模型可能为此提供了一种解决方案。

然而,挑战依然存在。目前的演示相对简单,该框架 如何扩展到更复杂的交互中仍是未知数。例如,当多个智能体同时行动并产生连锁反应时,或当世界规则需要根据智能体行为进行动态调整时,该系统是否依然有效且可控?这将是未来研究的关键方向。

这项研究提示,AI 世界的未来或许不在于选择“控制”或“自由”,而在于设计精妙的架构,让两者协同工作——用代码搭建稳固的舞台,再让 AI 上演无穷的戏剧。这种“网页世界模型”框架,正是指引 AI 智能体在虚拟世界中学习和进化的新蓝图。

正文完
 0
admin-gah
版权声明:本文于2026-01-12转载自the-decoder.com,共计1965字。
转载提示:此文章非本站原创文章,若需转载请联系原作者获得转载授权。
评论(没有评论)
验证码