共计 499 个字符,预计需要花费 2 分钟才能阅读完成。
Google 正在利用 Gemini AI 技术提升其机器人的智能水平,使其在导航和任务执行方面表现更佳。DeepMind 机器人团队最近的研究论文详细介绍了如何通过 Gemini 1.5 Pro 的长上下文窗口,让机器人能够更好地理解和响应自然语言指令。
研究团队通过录制特定区域的视频,利用 Gemini 1.5 Pro 让机器人“观看”并学习环境。随后,机器人能够根据观察到的内容执行命令,例如引导用户到电源插座充电。DeepMind 报告称,其 Gemini 驱动的机器人在超过 9000 平方英尺的区域内成功执行了超过 50 条指令,成功率达 90%。
此外,研究还发现 Gemini 1.5 Pro 能够帮助机器人规划更复杂的任务,如检查冰箱内的可乐库存并报告给用户。DeepMind 计划进一步探索这些应用的可能性。
尽管机器人在处理指令时需要 10-30 秒的时间,但这一进展预示着未来机器人将在日常生活中扮演更积极的角色,如帮助寻找遗失物品。
这一技术的进步不仅展示了 Google 在 AI 领域的深厚实力,也为未来智能机器人的广泛应用奠定了坚实基础。随着技术的不断成熟,我们有理由相信,智能机器人将在更多领域发挥其独特价值,为人类生活带来更多便利。
正文完