共计 970 个字符,预计需要花费 3 分钟才能阅读完成。
Google 近日宣布,将其在国际数学奥林匹克(IMO)中获奖的 AI 模型版本向公众开放,但这项功能仅限于每月 250 美元的 Google Ultra 订阅用户使用。
此前,Google 和 OpenAI 都曾大肆宣扬其 AI 模型在 IMO 中的出色表现。如今,Google 将其模型的一个版本整合到了 Gemini 应用中,作为高级订阅层级 Deep Think 的一部分。该订阅服务年费为 250 美元,或前三个月每月 125 美元。
尽管 Deep Think 是达到 IMO 金牌标准的模型的变体,但它在日常任务中速度更快。根据 Google 的内部评估,该模型在 2025 年 IMO 基准测试中达到了铜牌水平。
Deep Think 采用了并行思维技术,能够同时生成和处理多个想法,并在必要时结合不同的想法以找到最佳答案,从而在解决复杂问题方面表现出色。此外,延长的推理时间(也称为思考时间)使 Deep Think 在得出答案之前可以探索更多选项。新的强化学习技术也帮助模型随着时间的推移成为更好的问题解决者。
Google 表示,Deep Think 在迭代开发和设计、科学和数学发现以及编码方面表现出色。这些结果反映在 Gemini 2.5 Deep Think 在最先进基准测试中的表现,例如 Humanity’s Last Exam,这是一项包含 100 多个学科(如数学、科学和人文学科)的多模态问题的考试。
与 Gemini 2.5 Pro 相比,Gemini 2.5 Deep Think 在内容安全性和语调客观性方面表现更好,但需要注意的是,它拒绝良性请求的比率更高。
Google AI Ultra 订阅者可以在 Gemini 应用中每天通过一组固定的提示访问 Deep Think。要选择该模型,在模型选择器中选择 2.5 Pro 时,在提示栏中切换“Deep Think”。Google 还表示,正在努力在未来几周内通过 Gemini API 向一组可信的测试者发布带工具和不带工具的 Deep Think。
达到金牌标准的 Gemini 2.5 Deep Think 模型将与一小部分数学家和学者共享。目的是该模型将用于推进他们的工作,并希望这些经验能为改进提供反馈。
其他相关阅读:,