共计 633 个字符,预计需要花费 2 分钟才能阅读完成。
AI 软件公司 Anthropic 近日宣布了一款创新工具,该工具能够接管用户的鼠标光标,并在计算机上执行基本任务。这一工具名为“Computer Use”,是 Anthropic 与 Claude 和 Haiku 模型的进一步改进之一。目前,该工具仅通过 API 与公司的 3.5 Sonnet 模型结合提供,用户可以通过多步骤指令,让 AI 完成诸如查看屏幕、移动光标、点击按钮和输入文本等任务。
Anthropic 详细描述了该工具的工作原理:当开发者授权 Claude 使用特定计算机软件时,Claude 会分析屏幕截图,计算光标需要移动的像素数以点击正确位置。训练 Claude 准确计算像素是确保其有效操作的关键。
尽管该工具具有创新性,但它也有局限性。例如,它通过快速截屏而非实时视频流进行操作,可能会错过短暂的屏幕变化。此外,它尚不能执行拖放等常见操作。Anthropic 也承认,该工具有时会表现笨拙且容易出错。
该工具现已进入公开测试阶段,此前已在亚马逊、Canva、Asana 和 Notion 等公司的员工中进行了有限测试。Anthropic 表示,他们正在与开发者合作,改进工具功能并探索其积极用途。
这一发布标志着 AI 技术在自动化办公任务方面的又一进步,但也引发了关于自动化工具可能带来的就业影响的讨论。Anthropic 通过设置安全措施,试图预见并缓解潜在的滥用问题。
总的来说,Anthropic 的这一创新展示了 AI 技术在日常办公自动化方面的潜力,同时也提醒我们在推进技术应用时需谨慎考虑其社会影响。