共计 736 个字符,预计需要花费 2 分钟才能阅读完成。
大多数关于人形机器人的报道自然地聚焦于硬件设计。然而,随着开发者频繁提及“通用型人形机器人”的概念,我们的关注点也应随之转移。从单一用途系统向更通用系统的转变,标志着技术的一大飞跃,尽管我们尚未完全实现这一目标。
研究者们一直在探索如何开发一种机器人智能,这种智能能够充分利用双足人形设计带来的广泛运动能力。最近,生成式 AI 在机器人技术中的应用也引起了广泛关注。麻省理工学院的一项新研究表明,生成式 AI 可能会对人形机器人的发展产生深远影响。
在追求通用系统的道路上,训练是一个重大挑战。虽然我们对训练人类从事不同工作有丰富的经验,但机器人领域的训练方法仍然零散,缺乏系统性。尽管存在强化学习、模仿学习等有前景的方法,未来的解决方案可能需要结合这些方法,并辅以生成式 AI 模型。
麻省理工学院团队提出了一种名为政策组合(PoCo)的方法,该方法能够从多个小型、特定任务的数据集中提取并整合相关信息。这种方法涉及训练一个单独的扩散模型,以学习使用特定数据集完成任务的策略。通过将这些策略组合成一个通用政策,机器人能够在各种环境中执行多项任务。
麻省理工学院指出,扩散模型的整合显著提高了任务执行效率,提升了 20%。这不仅包括使用多种工具执行任务的能力,还涉及学习和适应新任务的能力。系统能够将来自不同数据集的相关信息整合成执行任务所需的行动链。
论文的主要作者 Lirui Wang 解释说:“这种方法的一个优点是,我们可以结合政策以获得最佳效果。例如,基于真实世界数据训练的政策可能提供更高的灵活性,而基于模拟训练的政策可能提供更广泛的通用性。”
这项研究的目标是创建智能系统,使机器人能够根据需要更换不同的工具来执行不同的任务。随着多功能系统的普及,我们正逐步接近实现通用型人形机器人的梦想。