微软发布AI代理市场模拟平台Magentic Marketplace,推动多代理协作研究

20次阅读
没有评论

共计 1969 个字符,预计需要花费 5 分钟才能阅读完成。

微软研究院近日推出名为 Magentic Marketplace 的开源模拟环境,旨在深入研究多代理协作的市场动态。该平台为研究人员提供了一个实验场所,用于测试 AI 代理在现实市场中的谈判、交易和协作行为,并监控这些系统的安全性与公平性。

微软发布 AI 代理市场模拟平台 Magentic Marketplace,推动多代理协作研究

在发布前,微软研究院 AI 前沿实验室的总经理 Ece Kamar 接受了采访。她表示,Magentic Marketplace 的开发部分受到了 AutoGen 的启发。AutoGen 是微软此前发布的一个广受 Python 开发者欢迎的代理开发框架,特别是在构建多代理 AI 系统方面。

AutoGen 是微软代理框架的一部分,已于一个月前发布,”Kamar 解释道,“因此我们能够将整个编程层集成到微软的产品中。现在,我们利用从 AutoGen 中学到的知识——人们如何使用它——来思考代理的未来发展。”

Magentic Marketplace 是什么?

Magentic Marketplace 的核心目标是让研究人员能够模拟 AI 代理的市场行为,测试代理在现实市场动态下的表现。该平台不仅关注代理之间的互动,还致力于确保系统的安全性和公平性。

微软发布 AI 代理市场模拟平台 Magentic Marketplace,推动多代理协作研究

尽管 Magentic Marketplace 目前是一个研究项目,但它未来可能演变为商业项目,类似于 AutoGen 如何发展为 微软代理框架。Kamar 指出:“我们预计未来会有公共市场出现。微软研究院可能不会直接构建这些市场,但这一领域的最新发布都朝着测试这些市场的方向发展。”

她补充道:“我个人认为,许多技术的使用方式将会被重新思考和设计,考虑到这些代理的存在。而市场将是我预计会看到大量活动的领域之一。”

“代理社会”中的协议

Magentic Marketplace 基于一个关于 AI 代理如何运作的工作理论,Kamar 将其称为“代理社会”。她在哈佛大学的博士论文正是关于 AI 代理的,她认为“代理社会”的核心在于 AI 代理的聚集、互动、协作和谈判。

“在‘代理社会’的概念中,核心是 AI 代理的聚集、互动、协作和谈判,”她表示,“同时,在人类的监督下,真正揭示当我们拥有这些代理时世界会是什么样子,这些代理如何帮助我们解决世界上的低效问题。”

“在‘代理社会’的概念中,核心是 AI 代理的聚集、互动、协作和谈判。”
– Ece Kamar, 微软研究院

研究的关键部分包括测试 模型上下文协议 (MCP)和 Agent2Agent(A2A)等通信协议,以及新兴的支付协议。目前,代理商业领域尚未形成默认的协议,尽管最近 OpenAI 宣布了 代理商业协议 (ACP), 谷歌 也推出了 代理支付协议(AP2)。

Kamar 预计,未来将出现新的协议,帮助代理协作,或者现有的协议如 MCPA2A 将扩展到市场用例中。例如,代理在交易中展示信息的正确方式是什么?

AI 代理模拟中的关键挑战与偏见

Kamar 承认,AI 代理带来了风险,如安全性和偏见问题,并描述了在市场模拟中遇到的一些挑战。

“我们看到的一个问题是,尽管我们有这些通信协议(如 MCPA2A 等),但驱动这些代理的模型有时会陷入某种决策悖论。如果他们有太多选择,他们在做出正确选择方面可能还不够有效。”

微软发布 AI 代理市场模拟平台 Magentic Marketplace,推动多代理协作研究

该团队还发现了一些偏见,例如“提案偏见”。目前的模型更倾向于快速提出的选项,即使这些选项并非最佳。Kamar 指出,为了从这些市场中获得最高效的效用,“我们需要以不同的方式训练和构建这些代理。”

她还提到了一些技术问题,例如“工具空间干扰”,即代理被大量 AI 工具所迷惑。为了解决这一问题,团队开发了一个名为 MCP Interviewer 的开源工具,帮助开发者在实际系统中发生工具干扰之前发现问题。

平衡 AI 代理的自主性与人类监督

Kamar 强调,研究人员在改进技术的同时,必须确保用户对这些技术的理解和控制。

“我认为,对于我们研究人员来说,最重要的是尽可能改进技术并围绕技术创造清晰度,”她表示,“当这些技术到了人们手中的时候,我们不会给他们一些我们构建但自己并不真正理解的东西;而是给他们一些我们真正理解、测试过的东西,我们了解其粗糙的边缘并努力改进它们。”

她补充说,团队也在考虑在这些代理系统中何时适合人类监督——在行业中更常被称为“人在回路”。

“如果我们要构建这些市场和生态系统,我们也可以花时间理解和构建这些层次,作为用户,我仍然拥有控制权……”
– Kamar

“所以我认为,这也将是一个范围,我们不会在第一天就实现完全的代理自主性,”她说,“如果我们要构建这些市场和生态系统,我们也可以花时间理解和构建这些层次,作为用户,我仍然拥有控制权——我仍然查看所有交互,我仍然查看选项,我仍然可以询问代理推荐给我的内容。”

在公共市场上线之前,全面测试代理如何协作不仅是明智的,而且不先进行模拟实际上是危险的。Magentic Marketplace 将帮助改进公司所需的 LLMs、协议和 AI 工具,以使公共代理市场变得可行。

正文完
 0
admin-gah
版权声明:本文于2025-11-06转载自The New Stack,共计1969字。
转载提示:此文章非本站原创文章,若需转载请联系原作者获得转载授权。
评论(没有评论)
验证码