共计 1175 个字符,预计需要花费 3 分钟才能阅读完成。
近年来,AI 公司纷纷涉足生成互动 AI 世界的领域。例如,微软推出的 AI 生成版《Quake》、AI 生成的《Minecraft》,以及 Google DeepMind 正在组建团队开发的“模拟世界”模型。如今,由皮克斯联合创始人 Edwin Catmull 支持的 AI 初创公司 Odyssey,也加入了这一行列,推出了名为“互动视频”的创新技术,并允许用户体验其研究预览版本。
Odyssey 在其网站上描述互动视频为“你可以观看并与之互动的视频,完全由 AI 实时生成”。这一技术理念类似于第一人称视频游戏,但环境更接近现实世界,而非由多边形构成。Odyssey 将其比作“全息甲板的早期版本”,但也承认“目前的体验感觉像是在探索一个充满故障的梦境——原始、不稳定,但无疑具有新意。”
在实际操作中,Odyssey 的互动视频让人感觉像是穿越了一个模糊版的 Google 街景。用户可以使用 WASD 键在实时生成的世界中行走,就像在游戏中一样。多个不同的世界可供切换,如带有小屋的树林、购物中心以及一栋大楼前的停车场。由于系统每次都会重新生成视野中的内容,这些世界每次都会略有不同,但画质通常较为模糊。
目前,用户只能探索两分半钟的预览内容,之后会停止,但可以重新加载并再次进入。
Odyssey 表示,他们使用位于美国和欧洲的 H100 GPU 集群生成互动视频。“利用输入和帧历史,模型生成它认为的下一帧,并实时流式传输给用户,”该公司在其网站上写道,并补充说这一过程可能“仅需”40 毫秒。
目前的预览版本还无法在短期内取代《堡垒之夜》。物体有时会有碰撞;例如,用户可能会被栅栏挡住,但尝试穿过一栋大房子时,却直接穿了过去。在另一次运行中,用户走下楼梯,却发现目标门口变成了一堵砖墙。当用户静止不动时,预览版本也会表现异常;在一次完整的实例中,用户完全没有触碰控制器,模型却慢慢让用户左转并逐渐靠近一堵墙。
在接受《The Verge》采访时,Odyssey 董事会成员 Catmull 无法给出画质何时会改善的具体答案。但他表示,Odyssey 正处于这一领域的“前沿”,并且“他们参与了这个更广泛的社区,因此如何实现这一目标的信息正在不断改进。”他承认图像仍然存在噪点,但表示大部分噪点,如建筑物上的纹理,正是“应用神经网络过滤器”所要解决的问题。
这还不是全息甲板
尽管这些小故障和问题可能很有趣,但这并不是一款出色的视频游戏。同时,这种技术也不会在短期内取代电影;世界以意想不到的方式变形和变化的方式太过分散注意力,而观众所看到的内容不会在眼前融化是优秀电影的关键部分。这甚至还不是两种媒介的良好融合——至少目前如此。
在体验预览版本时,用户可能会发现其中有一些有趣的东西。随着 AI 工具的快速发展,不难想象未来会出现一个没有这么多问题的版本。但这还不是全息甲板,如果 AI 视频要达到这一目标,还有很长的路要走。