Google DeepMind 推出机器人端 AI 模型 Gemini Robotics,离线运行更高效

2次阅读
没有评论

共计 850 个字符,预计需要花费 3 分钟才能阅读完成。

Google DeepMind 近日发布了其 Gemini Robotics AI 模型的设备端版本,该版本能够在没有互联网连接的情况下直接运行于机器人上。这一视觉 - 语言 - 动作模型(VLA)在性能上几乎与今年 3 月发布的旗舰 Gemini Robotics 模型相当,但 Google 强调,它“足够小巧高效,可以直接在机器人上运行”。

旗舰 Gemini Robotics 模型旨在帮助机器人完成各种物理任务,即使这些任务并未经过专门训练。它使机器人能够概括新情况、理解并响应命令,以及执行需要精细运动技能的任务。Google DeepMind 机器人负责人 Carolina Parada 向《The Verge》表示,最初的 Gemini Robotics 模型采用混合方法,使其能够在设备和云端上运行。然而,这个仅限设备的模型为用户提供了几乎与旗舰模型相当的离线功能。

Google DeepMind 推出机器人端 AI 模型 Gemini Robotics,离线运行更高效

据 Parada 介绍,设备端模型能够开箱即用地执行多种不同任务,并且仅需 50 到 100 次演示即可适应新情况。虽然 Google 仅在 ALOHA 机器人上训练了该模型,但该公司已成功将其适配到不同类型的机器人上,例如 Apptronik 的 Apollo 人形机器人和双臂 Franka FR3 机器人。

“Gemini Robotics 混合模型仍然更强大,但我们对这款设备端模型的性能感到非常惊讶,”Parada 表示。“我认为它更像是一个入门模型,或者适用于连接性较差的应用场景。”她补充道,这一模型也可能对安全要求严格的公司具有吸引力。

随着此次发布,Google 还推出了设备端模型的软件开发工具包(SDK),供开发者评估和微调模型。这是 Google DeepMind 的 VLA 模型首次提供此类工具。设备端 Gemini Robotics 模型及其 SDK 将提供给一组受信任的测试人员,同时 Google 继续努力最小化安全风险。

图片:Google
_Apptronik 的一款机器人正在运行设备端模型,将魔方放入袋中。_

GIF:Google
_Apptronik 的 Apollo 人形机器人紧随 Google 的 ALOHA 系统。_

正文完
 0
admin-gah
版权声明:本文于2025-06-25转载自TheVerge,共计850字。
转载提示:此文章非本站原创文章,若需转载请联系原作者获得转载授权。
评论(没有评论)
验证码