共计 2240 个字符,预计需要花费 6 分钟才能阅读完成。

Walrus 是一种结合了新颖稳定技术与最新自适应计算方法的现代 Transformer 模型,能够从高度多样化的物理动力学数据中学习。它通过一系列短时快照作为输入,预测系统演变的下一步。图片来源:_arXiv_ (2025)。DOI:10.48550/arxiv.2511.15684
与 ChatGPT 等基于语言或图像训练的主流 AI 模型不同,由 Polymathic AI 合作项目研究人员开发的新模型采用了真实的科学数据集进行训练。这些模型已展现出跨领域迁移学习的能力,能够运用从一个学科获得的知识,解决另一个学科中看似完全不同的问题。
专注于物理学的新型基础模型
近日,Polymathic AI 合作项目的成员发布了两款基于真实科学数据集训练的新 AI 模型,分别用于解决天文学和类流体系统问题。这两款名为 Walrus 和 AION-1 的模型,能够将学习到的物理原理应用于截然不同的领域。例如,Walrus 可以处理从恒星爆炸、Wi-Fi 信号到细菌运动等多种系统。
Walrus 的首席开发者、Polymathic AI 研究科学家 Michael McCabe 表示,这种跨学科技能有望加速科学发现,并在研究人员面临数据稀缺或预算有限时提供支持。McCabe 指出:“当新的物理现象出现在某个研究领域,而该领域对此并不熟悉,且没有时间逐一尝试所有可能适用的模型时,我们的目标是通过对更广泛类别的物理过程进行训练,创造出一个既易于使用、又具备良好泛化能力的工具。因为对某个领域‘新’的现象,可能早已在另一个领域被研究了一段时间。”
Polymathic AI 团队近期在 _arXiv_ 预印本服务器上发布了关于 Walrus 的论文,并在圣地亚哥的 NeurIPS 会议上展示了 AION-1。
Walrus 和 AION-1 属于“基础模型”,这意味着它们是在来自不同研究领域或实验的海量训练数据集上进行训练的。这与科学界大多数 AI 模型形成鲜明对比,后者通常针对特定子领域或问题进行专门训练。
基础模型并非学习特定情境的细节或从一组基本方程出发,而是致力于理解起作用的物理过程的基础原理。由于这些物理原理具有普适性,AI 学到的知识可以应用于共享相同底层物理规律的各类领域或问题。基础模型具备多重优势——从加速计算、在数据有限情况下表现良好,到发现不同领域共通的物理规律。
AION-1 的宇宙视角
AION-1 基于天文学巡天数据进行训练,这些数据本身规模庞大,包括斯隆数字巡天和盖亚任务的数据,涵盖超过 2 亿颗恒星、类星体和星系的观测数据,总计约 100 太字节。AION-1 利用图像、光谱及其他多种测量数据,尽可能全面地理解天体。例如,当科学家获得一个星系的低分辨率图像时,AION-1 能够从中提取更多信息,这些信息源自其对数百万其他星系物理规律的学习。
Walrus 应对复杂流体系统
Walrus 专注于流体和类流体系统。它使用了由 Polymathic AI 团队编译的大规模数据集“The Well”,该数据集涵盖了流体动力学中的 19 种不同场景和 63 个领域。总计 15 太字节的数据描述了从合并的中子星、声波到地球大气层运动等广泛物理系统中的密度、速度和压力等参数。
剑桥大学应用数学和理论物理系的 Polymathic AI 团队成员 Miles Cranmer 博士表示:“我仍然对多学科物理学基础模型能够运行并达到如此水平感到惊叹。这个问题本身就是最初激励我们启动 Polymathic AI 的原因之一,而 Walrus 感觉像是朝着这个方向迈出的一个重要里程碑。”
剑桥大学天文学研究所的 Payel Mukhopadhyay 博士补充道:“Walrus 像是向通用物理模拟 AI 迈出的真正一步——这是一个单一的基础模型,你可以将其适配于众多科学问题,而无需每次都从头开始重新训练。由于我们已经开源了代码和数据,我非常期待看到社区在其基础上构建出什么。”
跨感官与跨实验学习
AION-1 和 Walrus 能够利用在不同案例中观察到的物理知识,并将其应用于学习新事物,其原理类似于人类感官的协同作用。AION-1 团队在一篇项目博客中解释道:“多种感官共同作用——而非单独使用——能让你对体验有更全面的理解。随着时间的推移,大脑会学习事物外观、味道和气味之间的关联,因此如果一种感官不可用,你通常可以从其他感官推断出缺失的信息。”
当科学家进行新的实验或观测时,他们便有了一个起点——一份关于物理学在其他类似情境中如何表现的“地图”。Polymathic AI 的首席研究员 Shirley Ho 比喻道:“这就像见过许许多多的人。当你遇到一个新朋友时,因为你之前见过很多人,你能够在脑海中映射出……这个人与你之前所有朋友相比会是什么样子。”
为科学家打造强大工具
基础模型通过简化数据处理,使科学家的研究工作更为便捷。科学家不再需要为每个项目或任务从头构建新框架;相反,他们可以从已训练好的 AI 模型出发,将其作为基础。AION-1 的首席研究员、加州大学伯克利分校的 Liam Parker 表示:“我们对这类基础模型的愿景是,它能让任何人从他们感兴趣的数据的一个非常强大的嵌入表示开始……并且仍然达到最先进的精度,而无需从头构建整个流程。”
他们的目标是打造科学家能够在日常研究中实际使用的工具。Ho 总结道:“我们希望将所有 AI 智能带给需要它的科学家。”
总而言之,这些基于物理学训练的新 AI 模型,如 Walrus 和 AION-1,代表了科学发现工具的重要演进。它们不仅加速了跨学科研究,还为科学家提供了处理复杂物理系统的强大新方法。