Google Gemini AI 助力机器人智能升级

234次阅读

共计 499 个字符，预计需要花费 2 分钟才能阅读完成。

Google 正在利用 Gemini AI 技术提升其机器人的智能水平，使其在导航和任务执行方面表现更佳。DeepMind 机器人团队最近的研究论文详细介绍了如何通过 Gemini 1.5 Pro 的长上下文窗口，让机器人能够更好地理解和响应自然语言指令。

研究团队通过录制特定区域的视频，利用 Gemini 1.5 Pro 让机器人“观看”并学习环境。随后，机器人能够根据观察到的内容执行命令，例如引导用户到电源插座充电。DeepMind 报告称，其 Gemini 驱动的机器人在超过 9000 平方英尺的区域内成功执行了超过 50 条指令，成功率达 90%。

此外，研究还发现 Gemini 1.5 Pro 能够帮助机器人规划更复杂的任务，如检查冰箱内的可乐库存并报告给用户。DeepMind 计划进一步探索这些应用的可能性。

尽管机器人在处理指令时需要 10-30 秒的时间，但这一进展预示着未来机器人将在日常生活中扮演更积极的角色，如帮助寻找遗失物品。

Google Gemini AI 助力机器人智能升级