Google DeepMind 推出机器人端 AI 模型 Gemini Robotics，离线运行更高效

141次阅读

共计 850 个字符，预计需要花费 3 分钟才能阅读完成。

Google DeepMind 近日发布了其 Gemini Robotics AI 模型的设备端版本，该版本能够在没有互联网连接的情况下直接运行于机器人上。这一视觉 - 语言 - 动作模型（VLA）在性能上几乎与今年 3 月发布的旗舰 Gemini Robotics 模型相当，但 Google 强调，它“足够小巧高效，可以直接在机器人上运行”。

旗舰 Gemini Robotics 模型旨在帮助机器人完成各种物理任务，即使这些任务并未经过专门训练。它使机器人能够概括新情况、理解并响应命令，以及执行需要精细运动技能的任务。Google DeepMind 机器人负责人 Carolina Parada 向《The Verge》表示，最初的 Gemini Robotics 模型采用混合方法，使其能够在设备和云端上运行。然而，这个仅限设备的模型为用户提供了几乎与旗舰模型相当的离线功能。

据 Parada 介绍，设备端模型能够开箱即用地执行多种不同任务，并且仅需 50 到 100 次演示即可适应新情况。虽然 Google 仅在 ALOHA 机器人上训练了该模型，但该公司已成功将其适配到不同类型的机器人上，例如 Apptronik 的 Apollo 人形机器人和双臂 Franka FR3 机器人。

“Gemini Robotics 混合模型仍然更强大，但我们对这款设备端模型的性能感到非常惊讶，”Parada 表示。“我认为它更像是一个入门模型，或者适用于连接性较差的应用场景。”她补充道，这一模型也可能对安全要求严格的公司具有吸引力。

随着此次发布，Google 还推出了设备端模型的软件开发工具包（SDK），供开发者评估和微调模型。这是 Google DeepMind 的 VLA 模型首次提供此类工具。设备端 Gemini Robotics 模型及其 SDK 将提供给一组受信任的测试人员，同时 Google 继续努力最小化安全风险。

图片：Google
_Apptronik 的一款机器人正在运行设备端模型，将魔方放入袋中。_

GIF：Google
_Apptronik 的 Apollo 人形机器人紧随 Google 的 ALOHA 系统。_

正文完