共计 727 个字符,预计需要花费 2 分钟才能阅读完成。
Google 最近发布了一款名为 Gemini 2.0 Flash Thinking Experimental 的新型 AI 推理模型。尽管该模型仍处于实验阶段,但其在多模态理解、推理和编码任务中的表现已经引起了广泛关注。
该模型目前可在 Google 的 AI 原型平台 AI Studio 上使用。根据模型卡的描述,它特别擅长处理编程、数学和物理等领域的复杂问题。
在 X 上的一篇帖子中,AI Studio 的产品负责人 Logan Kilpatrick 称这个模型是“Google 推理之旅的第一步”。而 Google DeepMind 的首席科学家 Jeff Dean 也在他的帖子中提到,该模型经过训练,能够通过“思维”来增强其推理能力。
从设计上看,Gemini 2.0 Flash Thinking Experimental 似乎与 OpenAI 的 o1 等推理模型有相似之处。与大多数 AI 不同,推理模型能够进行自我事实核查,这使得它们在处理复杂问题时更加可靠,避免了传统 AI 模型中常见的错误。
然而,推理模型也有一个明显的缺点:它们通常需要更长的时间来得出答案,可能是几秒到几分钟不等。
在实际使用中,Gemini 2.0 Flash Thinking Experimental 在接收到提示后,会先暂停一下,考虑多个相关提示,并在过程中“解释”它的推理过程。经过一段时间的思考后,它会总结出一个它认为最准确的答案。
尽管如此,该模型在某些任务上仍存在不足。例如,当我问它“strawberry”这个词里有几个 R 时,它错误地回答“两个”。显然,这个答案是错的,因为“strawberry”里只有一个 R。
尽管如此,推理模型无疑是 AI 领域的一个有趣方向。随着 Google 和其他公司不断推出新的推理模型,AI 的未来将如何发展,我们拭目以待。