共计 860 个字符,预计需要花费 3 分钟才能阅读完成。
Hugging Face 的联合创始人兼首席科学官 Thomas Wolf 近日阐述了该公司如何将其在 transformer 技术普及中采用的社区驱动方法,应用于新兴的机器人领域。Wolf 详细介绍了 Hugging Face 的雄心勃勃项目 LeRobot,该项目旨在通过开源工具、数据集和经济实惠的硬件,推动机器人技术的普及。他还分享了自己关于将数百万软件开发者转变为机器人专家的愿景,探讨了机器人领域与语言模型相比数据稀缺的挑战,并指出物理 AI 目前正处于与大语言模型(LLMs)几年前相同的拐点。
Hugging Face 在机器人领域的成功与其 transformer 战略相呼应——通过创建易于使用的工具,将小众专家转变为广泛的横向社区。目前,他们的机器人社区已呈指数级增长,吸引了 10,000 名开发者。这一成就证明,提供基于 Python 的简单工具能够普及复杂领域,并让软件开发者逐步成为机器人专家。
Wolf 主张采用“多样化形态的星系”,而非追求高成本的仿人机器人。例如,Hugging Face 推出的售价 300 美元的机械臂,旨在优先考虑可访问性,并促进更多实验。这种方法避免了只有富裕用户才能负担得起 10 万美元仿人机器人的精英化场景,使机器人技术更加普惠。
与受益于大规模互联网数据集的大语言模型不同,机器人技术需要多样化、多位置的数据以实现泛化。Wolf 指出,关键瓶颈不仅在于收集更多的机器人任务演示,还在于确保足够的环境和上下文多样性,以便机器人能够适应其训练环境之外的情况。
与其他 AI 应用相比,机器人技术更需要本地模型执行。这是因为物理机器人失去互联网连接可能会导致危险的故障。这种安全性要求使得开源模型在机器人技术中特别有价值,因为“尽可能靠近硬件”运行模型可以防止灾难性场景的发生。
Wolf 强调,真正的进步需要教会人们训练模型,而不仅仅是提供预训练权重。他在获取苏联超导研究方面的背景经历,塑造了他对开放科学的信念:共享训练方法、数据集和实现细节比单纯发布模型创造更多价值。这种开放的方式使其他人能够在此基础上改进工作,从而加速创新。