共计 1121 个字符,预计需要花费 3 分钟才能阅读完成。
微软近日推出了 Azure AI Search 中代理检索(Agentic Retrieval)的公开预览版,这是一个能够自主规划和执行复杂问题检索策略的查询引擎。据该公司称,与传统的 RAG(Retrieval-Augmented Generation)相比,这一新系统在对话 AI 中的答案相关性提升了高达 40%。这一多轮系统利用对话历史和 Azure OpenAI,将查询分解为多个聚焦的子查询,并在文本和向量嵌入中并行执行。
这一新功能通过 2025-05-01-preview 数据平面 REST API 和 Azure SDK 预发布包中的 Knowledge Agents 对象以编程方式支持。它基于 Azure AI Search 现有的索引、一个链接到 Azure OpenAI 的专用“Agent”资源以及协调整个过程的检索引擎。微软将代理检索定位为构建更复杂知识检索系统的关键一步,专门为智能代理设计,并为下游消费提供高质量的基数据。
根据文档,代理检索过程包括以下阶段:首先,LLM(大型语言模型)分析整个聊天线程以识别核心信息。随后,它规划一个包含聊天历史和原始查询的检索策略。接下来,每个子查询同时运行,利用 Azure AI Search 的关键词和语义搜索能力。在微软 Build 会议中,Matthew Gotteiner 解释道:,
需要注意的是,代理检索的整体速度与生成的子查询数量直接相关。虽然并行运行子查询旨在加速过程,但需要大量子查询的更复杂查询自然需要更长的时间来完成。反直觉的是,生成较少、更广泛子查询的“迷你”查询规划器可能比设计为生成大量高度聚焦子查询的“完整”规划器更快返回结果。
结果使用平台的语义排序器重新排序,形成一个统一的基数据负载,包含最高匹配项和结构化元数据。最后,API 还返回检索过程的详细活动日志。
微软的软件工程师 Akshay Kokane 在 Medium 博客文章中总结道:,
传统的 RAG 系统是增强 LLM 领域特定知识的良好起点——尤其是在使用 Semantic Kernel 和 Azure AI Search 等工具时,它们简化了嵌入和检索。然而,随着企业用例变得更加复杂,静态、线性工作流的局限性变得明显。
代理 RAG (ARAG) 通过引入动态推理、智能工具选择和迭代优化来弥补这一差距。代理可以调整其搜索策略,评估结果,并构建更精确、上下文感知的答案——使其非常适合不断变化的业务需求、合规工作流或多源数据环境。
最后,公开预览版目前仅在部分区域可用,代理检索的定价包括 Azure OpenAI 查询规划和 Azure AI Search 语义排序的按令牌计费,这两者在初始预览期间都是免费的。开发者可以访问文档、cookbook 和与 Azure AI Agent Service 的集成指南。