共计 891 个字符,预计需要花费 3 分钟才能阅读完成。
微软近日推出了一款专为游戏创意设计的新生成式 AI 模型,名为 WHAM(世界与人类行动模型)。该模型由微软研究院的游戏智能团队与《地狱之刃》开发商 Ninja Theory 合作开发,旨在通过生成视觉效果和控制器操作来加速游戏创作过程。
微软研究院的高级首席研究经理 Katja Hofmann 在一篇博客文章中详细介绍了 WHAM 的功能。她表示,WHAM 能够通过仅 10 个初始帧(约一秒)的人类游戏操作和整个游戏序列的控制器操作,生成“在几分钟内保持一致性的复杂游戏序列”。这一技术被命名为 Muse,其训练数据来自 Ninja Theory 于 2020 年推出的多人游戏《Bleeding Edge》。
微软不仅开源了 Muse 的权重和样本数据,还提供了一个名为 WHAM 演示器的概念原型,允许用户通过可视化界面与模型进行交互。这一工具展示了 Muse 如何生成与实际游戏序列高度相似的动态内容,尤其是在“世界模型模式”下,Muse 能够预测游戏从初始提示序列中的演变。
Ninja Theory 的技术总监 Gavin Costello 对这一合作表示赞赏,称其为“令人惊叹”的技术探索。他提到,从最初的黑客马拉松到如今构建能够模仿人类玩家行为的 AI 代理,Muse 的潜力令人大开眼界。特别是在人类指导下,WHAM 能够构思出全新的《Bleeding Edge》游戏序列,展示了生成式 AI 在游戏创作中的巨大潜力。
然而,生成式 AI 在创意产业中的应用也引发了争议。随着游戏开发成本的上升,发行商越来越多地寻求 AI 工具来加快工作流程并降低成本。但与此同时,许多游戏开发者担心像 Muse 这样的模型可能会威胁到他们的工作。
对此,Hofmann 强调,微软团队的目标是探索如何让这些模型有效支持人类创意,而不是取代人类。她表示:“我期待看到社区以多种方式探索这些模型,并在我们的研究基础上进行构建。”她认为,这些模型将帮助理解生成式 AI 如何支持游戏创意,并为未来基于 AI 的新型游戏体验铺平道路,包括 Xbox 团队正在探索的用例。
微软此次推出的 WHAM 模型无疑为游戏开发领域带来了新的可能性,但如何在技术进步与人类创意之间找到平衡,仍将是业界面临的长期挑战。