DeepMind 新 AI 工具 AlphaEvolve:数学与科学领域的卓越表现

1次阅读
没有评论

共计 947 个字符,预计需要花费 3 分钟才能阅读完成。

Google 旗下的 AI 研究实验室 DeepMind 近日宣布,已成功开发出一款名为 AlphaEvolve 的新型 AI 系统,专门用于解决具有“机器可评分”答案的问题。这款系统在实验中展现出了优化 Google AI 模型训练基础设施的潜力。

DeepMind 透露,他们正在构建一个用户界面,以便与 AlphaEvolve 进行交互,并计划在广泛推广之前,先为部分学者提供早期访问权限。

DeepMind 新 AI 工具 AlphaEvolve:数学与科学领域的卓越表现

AI 模型普遍存在“幻觉”问题,即它们有时会基于概率架构自信地编造内容。例如,OpenAI 的最新 AI 模型 o3 比其前身更容易产生幻觉,这凸显了该问题的复杂性。为了应对这一挑战,AlphaEvolve 引入了一种巧妙的机制:自动评估系统。该系统能够生成、批评并汇集问题的可能答案,然后自动评估并评分这些答案的准确性。

尽管 AlphaEvolve 并非首个采用这种方法的系统,但 DeepMind 强调,其对“最先进”模型(特别是 Gemini 模型)的运用,使其在能力上超越了早期的 AI 实例。

使用 AlphaEvolve 时,用户需向系统提出问题,并可选地提供指令、方程、代码片段和相关文献等细节。此外,用户还需提供一种机制,以公式的形式自动评估系统的答案。由于 AlphaEvolve 只能解决可以自我评估的问题,因此其应用范围主要局限于计算机科学和系统优化等领域。另一个主要限制是,AlphaEvolve 只能将解决方案描述为算法,因此不适合处理非数值问题。

为了验证 AlphaEvolve 的性能,DeepMind 让其尝试了一组约 50 个数学问题,涵盖从几何到组合数学的多个分支。DeepMind 声称,AlphaEvolve 在 75% 的情况下“重新发现”了这些问题的已知最佳答案,并在 20% 的情况下发现了改进的解决方案。

在实际应用中,AlphaEvolve 也展现出了不俗的表现。例如,在提高 Google 数据中心效率和加速模型训练方面,AlphaEvolve 生成了一种算法,平均可连续恢复 Google 全球计算资源的 0.7%。此外,该系统还提出了一种优化方案,将 Google 训练其 Gemini 模型的总时间减少了 1%。

尽管 AlphaEvolve 并未取得突破性发现,但其在节省时间、让专家专注于更重要工作方面的潜力,与 DeepMind 提出的其他 AI 实验室的论点不谋而合。

正文完
 0
admin-gah
版权声明:本文于2025-05-15转载自TechCrunch,共计947字。
转载提示:此文章非本站原创文章,若需转载请联系原作者获得转载授权。
评论(没有评论)
验证码