共计 1086 个字符,预计需要花费 3 分钟才能阅读完成。
在庆祝成立 50 周年之际,微软对其人工智能助手 Copilot 进行了一次大规模更新,新增了多项功能,使其更接近 ChatGPT 或 Claude 等竞争对手。Copilot 原本基于 OpenAI 的模型,如今新增了记忆、个性化、网页操作、播客创建、摄像头和屏幕分析、深度研究等功能,进一步提升了用户体验。,
个性化体验的增强
通过“记忆”功能,Copilot 现在能够追踪用户的偏好、兴趣以及生日等详细信息,并利用这些数据定制响应和建议,甚至主动提出相关提示。微软表示,用户可以选择让 Copilot 记住哪些信息,也可以完全关闭该功能。这一功能是微软为 Copilot 打造个性化体验的一部分。微软 AI 首席执行官 Mustafa Suleyman 表示:“Copilot 不仅仅是人工智能,它是属于你的。每个 Copilot 都将有自己独特的风格和属性组合,以适应我们每个人的需求。”
网页操作与视觉功能
Copilot 新增的“操作”功能使其能够通过网页浏览器执行任务,类似于 OpenAI 的 Operator 代理或亚马逊的 Nova Act 模型。微软建议,该功能可以用于预订演出门票、餐厅预订和购物,尤其是与新的购物功能结合时,Copilot 可以研究产品并寻找折扣和促销活动。
此外,Copilot Vision 功能从 2024 年 12 月的网页工具扩展到 Windows 和移动应用程序。在 Windows 上,Copilot 能够“查看”其他应用程序和文件中的内容,以回答问题或与文件和内容进行交互;而在 iOS 和 Android 上,它可以分析手机摄像头拍摄的内容或相机胶卷中的照片。,
深度研究与播客创建
“深度研究”功能允许 Copilot 为复杂项目分析大量文档或在线资源,其研究能力正在与 Bing 集成,以在搜索引擎中提供 AI 驱动的响应。与其他 AI 工具一样,Copilot 现在还可以利用其研究生成播客风格的音频来解释某个主题。新的“页面”功能则允许它将跨文档的笔记和研究组织到一个画布中,方便用户整理和查看。,
功能推出与竞争态势
微软表示,许多新功能从今天开始以“初始版本”推出,并将在“未来几周和几个月内”逐步改进,具体可用性因功能、平台和市场而异。尽管这些功能并非首创——例如 ChatGPT 去年已推出记忆功能,Google Gemini 也有视觉模式——但微软一次性整合如此多功能,表明其致力于在人工智能领域保持竞争力,并充分利用其对 OpenAI 的投资。
此次更新不仅展示了微软在人工智能技术上的持续创新,也进一步巩固了 Copilot 作为多功能助手的市场地位。随着 AI 技术的快速发展,微软显然希望通过 Copilot 为用户提供更智能、更个性化的体验。