Google推出Gemini 2.0 Flash Thinking：AI推理模型的新突破

208次阅读

共计 1015 个字符，预计需要花费 3 分钟才能阅读完成。

最近，Google 显然是坐不住了，急着要在 AI 领域赶上 OpenAI 的步伐。他们刚刚发布了一个新的 AI 模型，叫做 Gemini 2.0 Flash Thinking，听起来挺高大上的，对吧？

Google 最近的动作挺频繁的，感觉他们一直在努力通过各种 AI 发布来超越 OpenAI。就在周四，他们推出了这个所谓的“推理”AI 模型，名字叫 [Gemini 2.0 Flash Thinking 实验性](https://ai.google.dev/gemini-api/docs/thinking-mode)。这个模型有点像 OpenAI 的 o1，用了一些“推理”技术，目的是让 AI 对问题进行更深入的思考。

Google 推出 Gemini 2.0 Flash Thinking：AI 推理模型的新突破

不过，TechCrunch 的记者 Kyle Wiggers 在早期测试中发现，这个模型在某些基本任务上还是有点问题。比如，它居然错误地计算出“strawberry”这个词里有两个 R。这让我有点怀疑，这个所谓的“推理”模型到底靠不靠谱。

这些推理模型和普通的 AI 模型有什么不同呢？它们引入了一个自我检查机制的反馈循环，有点像 2023 年初那些业余项目，比如“Baby AGI”里用到的技术。这个过程需要更多的计算时间，所以响应时间会稍微长一点。传统的训练方法已经有点力不从心了，所以公司们开始转向这种推理模型。

Google DeepMind 的首席科学家 Jeff Dean 在 X 上说，这个模型获得了额外的计算能力，他还写道：“当我们增加推理时间计算时，我们看到了有希望的结果！”这个模型的工作方式是，它会暂停一下，考虑多个相关的提示，然后给出它认为最准确的答案。

自从 OpenAI 在 9 月份推出了 o1-preview 和 o1-mini，其他公司也开始跟进。比如，DeepSeek 在 11 月初推出了 DeepSeek-R1，而阿里巴巴的 Qwen 团队也在本月早些时候发布了他们的“推理”模型 QwQ。

虽然有人认为推理模型可以帮助解决复杂的数学或学术问题，但这些模型可能并不适合所有人。它们在某些基准测试中表现不错，但实际有用性和准确性还是个问题。而且，运行这些模型需要很高的计算成本，这也引发了一些对其长期可行性的质疑。OpenAI 的 ChatGPT Pro 每月费用高达 200 美元，就是这个原因。

尽管如此，Google 似乎对这一 AI 技术非常认真。Google AI Studio 的员工 Logan Kilpatrick 在 X 上说，这是“我们推理之旅的第一步”。看来，Google 是铁了心要在这条路上走下去了。

正文完