共计 1068 个字符,预计需要花费 3 分钟才能阅读完成。
Anthropic 最新发布的 AI 模型 Claude Sonnet 4.5 在 AI 代理和编码领域取得了显著进展。该模型能够连续自主运行 30 小时,创下了该公司模型运行时间的新纪录,标志着 Anthropic 在 AI 技术竞争中的重要一步。
据 Anthropic 称,Claude Sonnet 4.5 在测试中成功编写了一款类似于 Slack 或 Teams 的聊天应用程序,生成了约 11,000 行代码,并在任务完成后自动停止运行。这一表现远超此前发布的 Opus 4 模型,后者曾因能够连续运行 7 小时而成为头条新闻。
Anthropic 将 Claude Sonnet 4.5 称为“现实世界代理、编码和计算机使用的最佳模型”,并强调其在网络安全、金融服务和研究等领域的卓越表现。测试用户之一 Canva 表示,该模型在“复杂、长上下文任务”中表现出色,从代码库工程到产品功能和研究都提供了有力支持。
Anthropic 产品管理负责人 Dianne Penn 在接受《The Verge》采访时透露,Claude Sonnet 4.5 在浏览网页和使用计算机方面的能力比去年 10 月的技术提高了三倍以上。她表示,团队根据早期用户的反馈,在过去一个月内集中精力对模型进行了改进。
Claude.ai 的产品负责人 Scott White 则指出,新模型能够以“首席参谋级别”运行,能够处理诸如安排会议、分析数据仪表板、编写状态更新等复杂任务。虽然 White 和 Penn 尚未尝试使用新模型进行“氛围编码”,但 Penn 表示她在招聘过程中已经利用 Claude Sonnet 4.5 进行深度网络搜索,生成了包含 LinkedIn 配置文件的电子表格,极大提高了招聘效率。
Anthropic 还表示,Claude Sonnet 4.5 的发布将与其他更新结合,帮助开发者编写自己的 AI 代理。该公司在发布中写道:“我们将模型的发布与虚拟机器、内存、上下文管理和多代理支持的访问结合起来,这实质上打包了与 Claude Code 相同的构建模块,使开发者能够构建自己的尖端代理。”
随着 Anthropic、OpenAI 和谷歌等公司不断发布增量更新和功能,AI 技术正逐渐渗透到消费者和企业的日常工作中。几乎每个月,甚至每周,争夺关注和依赖的竞争都在升温。几天前,OpenAI 宣布了 Pulse,这是其最新的 ChatGPT 功能,旨在成为用户早晨例行程序的一部分,并研究与当天相关的主题。
Anthropic 的最新举措无疑将进一步推动 AI 技术在现实世界中的应用,同时也加剧了行业内的竞争。随着 AI 代理和编码能力的不断提升,未来 AI 在企业和个人生活中的作用将更加广泛和深入。