共计 743 个字符,预计需要花费 2 分钟才能阅读完成。
谷歌近日对其 Gemini 2.0 大语言模型进行了重大调整,推出了 ’AI 联合科学家 ’ 版本。这一创新不仅展示了人工智能在科学研究中的潜力,更凸显了 ’ 测试时扩展 ’ 技术的重要性。
Gemini 2.0 的核心创新在于其 ’ 测试时扩展 ’ 机制。与传统的 AI 模型不同,Gemini 在推理阶段而非训练阶段投入大量计算资源,通过迭代审查和重新制定输出来提升模型性能。这种方法在 OpenAI 的 o1 模型和 DeepSeek AI 中也有体现,但 Gemini 将其推向了新的高度。
AI 联合科学家的设计理念是 ’ 人类在环 ’,即与研究人员密切合作,加速科学发现进程。该系统由多个专门代理组成,包括生成、反思、排名、进化和元评审等模块。这些模块并行工作,辅以内存管理功能,能够快速生成研究假设、详细研究概述和实验方案。
在实际应用中,AI 联合科学家展现出了惊人的效率。以细菌进化形成新病原体的研究为例,该系统仅用两天时间就生成了相关假设,而人类科学家完成相同工作则需要十年。这一成果得益于系统的 ’ 锦标赛 ’ 机制,它采用 Elo 评分系统对多个假设进行排名和优化,使更好的假设脱颖而出。
根据 15 位人类专家的评审,随着计算时间的增加,AI 联合科学家的输出质量显著提升,不仅超越了基础 Gemini 2.0 模型,也优于未辅助的人类专家。专家们普遍认为,AI 联合科学家的输出具有更高的新颖性和影响力潜力。
值得注意的是,尽管谷歌没有公布 AI 联合科学家的具体计算成本,但研究团队乐观地认为,随着计算成本的快速下降,这种先进的 AI 系统将很快在更广泛的研究实验室中普及。
这项创新不仅展示了 AI 在科学研究中的巨大潜力,也为未来的人机协作研究模式提供了新的思路。随着技术的不断进步,AI 联合科学家有望成为科研人员的得力助手,加速科学发现的进程,推动人类知识边界的拓展。