代码设定边界AI填充世界，新框架如何为智能体创造无限宇宙？

23次阅读

共计 1965 个字符，预计需要花费 5 分钟才能阅读完成。

想象一个虚拟世界：你可以推开任何一扇门，与任何 NPC 对话，探索任何角落——但无论你如何尝试，都无法穿过上锁的门，也无法花掉不属于你的钱。这个世界既拥有生成式 AI 的无限创意，又保持着电子游戏般的严格规则。这正是普林斯顿大学、加州大学洛杉矶分校和宾夕法尼亚大学的研究团队提出的新范式。

他们开发了一种名为“网页世界模型”（Web World Models）的方法，旨在为 AI 智能体构建稳定、可扩展且逻辑自洽的持久探索环境。其核心在于一个巧妙的双层架构：底层用标准网页代码（TypeScript）定义不可违背的规则与逻辑，上层则由大语言模型（LLM）负责填充故事、描述与细节。

代码设定边界 AI 填充世界，新框架如何为智能体创造无限宇宙？

传统上，构建虚拟世界面临两难：基于数据库的网页应用逻辑严谨、完全可控，但内容固定、上下文有限；而纯生成式世界模型（如某些 AI 游戏引擎）能创造丰富多样的内容，却难以保证一致性，容易“失控”。网页世界模型试图融合二者之长，为 AI 智能体训练提供新思路。,

该模型的第一层是纯粹的代码层。研究人员使用 TypeScript 明确定义了世界中存在什么实体、实体间如何连接、以及允许执行哪些动作。这一层充当了“世界宪法”的角色，强制执行最基本的逻辑一致性。例如，代码会规定一扇门是否上锁、一件物品是否可被拾取、一次交易是否需要足够的货币。任何行动都必须先通过代码层的逻辑校验。

第二层则交由大语言模型驱动。在代码许可的范围内，LLM 负责让世界“活”起来：生成环境的文字描述、构思非玩家角色（NPC）的对话、渲染美学细节。关键在于，LLM 的创造力被严格限制在代码设定的“牢笼”内。当玩家尝试一个动作时，系统会首先运行代码检查其合法性，只有通过后，才会召唤 AI 来叙述“发生了什么”。这意味着，无论语言模型多么天马行空，都无法让玩家做出代码禁止的事情，从而保障了虚拟世界的稳定性和可控性。,

构建一个近乎无限的、可持久访问的虚拟世界，如何解决海量数据存储问题？研究团队采用了一个巧妙的方案：他们根本不存储具体世界内容，而是根据需要实时生成。

其秘诀在于一个确定性函数（哈希函数）。每个地点（例如一个星球）都由一组唯一的坐标标识。当玩家访问时，系统将这组坐标输入哈希函数，得到一个固定的“种子”。这个种子用于初始化语言模型的生成参数，确保 每次根据相同坐标生成的世界内容完全一致。玩家离开后再返回，看到的将是同一个星球，这不是因为数据被保存了，而是因为相同的数学计算总是产生相同的结果。研究人员称之为“无存储成本的对象恒存性”。

该系统还具备鲁棒性设计。如果语言模型响应缓慢或崩溃，系统会自动回退到预制的模板描述。世界会失去丰富性，但底层规则依然有效，应用程序不会瘫痪。这使其区别于完全依赖生成式 AI 的系统，为 AI 智能体提供了更可靠的训练环境。,

为了展示该框架的通用性，团队构建了七个演示应用：,

无限旅行图集：将地球变成一个可交互式探索的球体。点击任意地点，系统会基于真实地理坐标（代码层）生成该地的描述、旅行路线和相关故事（LLM 层）。
银河旅行图集：为科幻宇宙构建类似系统。代码层按规则生成星系、恒星和行星；LLM 层则添加任务、角色和教育内容。
AI Spire（卡牌游戏）：玩家可以用自然语言请求自定义卡牌（如“一个能造成大量火焰伤害但同时冻结对手的火球”）。LLM 生成卡牌概念后，代码层会进行模式验证，确保其符合游戏规则（如费用、类型限制），然后才由游戏引擎实现效果。
AI Alchemy（沙盒模拟）：元素相互作用，AI 会建议新的反应规则。
Cosmic Voyager（3D 行星探索器）：探索行星时伴有持续的 AI 生成解说。
WWMPedia：生成维基百科风格的文章。
Bookshelf：用于生成长篇文学作品的系统。

研究人员将其工作定位为介于僵化数据库与不可控生成模型之间的“第三条道路”。它结合了经典软件工程的可靠性与大语言模型的灵活性，为训练 AI 智能体提供了潜在的理想沙盒。自主智能体需要在学习环境中进行试错，这种环境必须足够一致，以便智能体总结规律；同时又需足够灵活，以应对未见过的情景。网页世界模型可能为此提供了一种解决方案。

然而，挑战依然存在。目前的演示相对简单，该框架 如何扩展到更复杂的交互中仍是未知数。例如，当多个智能体同时行动并产生连锁反应时，或当世界规则需要根据智能体行为进行动态调整时，该系统是否依然有效且可控？这将是未来研究的关键方向。

这项研究提示，AI 世界的未来或许不在于选择“控制”或“自由”，而在于设计精妙的架构，让两者协同工作——用代码搭建稳固的舞台，再让 AI 上演无穷的戏剧。这种“网页世界模型”框架，正是指引 AI 智能体在虚拟世界中学习和进化的新蓝图。

正文完