Google推出Gemini 2.0 Flash Thinking:AI推理模型的新突破

58次阅读
没有评论

共计 1015 个字符,预计需要花费 3 分钟才能阅读完成。

最近,Google 显然是坐不住了,急着要在 AI 领域赶上 OpenAI 的步伐。他们刚刚发布了一个新的 AI 模型,叫做 Gemini 2.0 Flash Thinking,听起来挺高大上的,对吧?

Google 最近的动作挺频繁的,感觉他们一直在努力通过各种 AI 发布来超越 OpenAI。就在周四,他们推出了这个所谓的“推理”AI 模型,名字叫 [Gemini 2.0 Flash Thinking 实验性](https://ai.google.dev/gemini-api/docs/thinking-mode)。这个模型有点像 OpenAI 的 o1,用了一些“推理”技术,目的是让 AI 对问题进行更深入的思考。

Google 推出 Gemini 2.0 Flash Thinking:AI 推理模型的新突破

不过,TechCrunch 的记者 Kyle Wiggers 在早期测试中发现,这个模型在某些基本任务上还是有点问题。比如,它居然错误地计算出“strawberry”这个词里有两个 R。这让我有点怀疑,这个所谓的“推理”模型到底靠不靠谱。

这些推理模型和普通的 AI 模型有什么不同呢?它们引入了一个自我检查机制的反馈循环,有点像 2023 年初那些业余项目,比如“Baby AGI”里用到的技术。这个过程需要更多的计算时间,所以响应时间会稍微长一点。传统的训练方法已经有点力不从心了,所以公司们开始转向这种推理模型。

Google DeepMind 的首席科学家 Jeff Dean 在 X 上说,这个模型获得了额外的计算能力,他还写道:“当我们增加推理时间计算时,我们看到了有希望的结果!”这个模型的工作方式是,它会暂停一下,考虑多个相关的提示,然后给出它认为最准确的答案。

自从 OpenAI 在 9 月份推出了 o1-preview 和 o1-mini,其他公司也开始跟进。比如,DeepSeek 在 11 月初推出了 DeepSeek-R1,而阿里巴巴的 Qwen 团队也在本月早些时候发布了他们的“推理”模型 QwQ。

虽然有人认为推理模型可以帮助解决复杂的数学或学术问题,但这些模型可能并不适合所有人。它们在某些基准测试中表现不错,但实际有用性和准确性还是个问题。而且,运行这些模型需要很高的计算成本,这也引发了一些对其长期可行性的质疑。OpenAI 的 ChatGPT Pro 每月费用高达 200 美元,就是这个原因。

尽管如此,Google 似乎对这一 AI 技术非常认真。Google AI Studio 的员工 Logan Kilpatrick 在 X 上说,这是“我们推理之旅的第一步”。看来,Google 是铁了心要在这条路上走下去了。

正文完
 0
admin-gah
版权声明:本文于2024-12-21转载自Ars Technica,共计1015字。
转载提示:此文章非本站原创文章,若需转载请联系原作者获得转载授权。
评论(没有评论)
验证码