Anthropic 发布 Claude Sonnet 4.5，AI 代理和编码领域的重大突破

98次阅读

共计 1068 个字符，预计需要花费 3 分钟才能阅读完成。

Anthropic 最新发布的 AI 模型 Claude Sonnet 4.5 在 AI 代理和编码领域取得了显著进展。该模型能够连续自主运行 30 小时，创下了该公司模型运行时间的新纪录，标志着 Anthropic 在 AI 技术竞争中的重要一步。

据 Anthropic 称，Claude Sonnet 4.5 在测试中成功编写了一款类似于 Slack 或 Teams 的聊天应用程序，生成了约 11,000 行代码，并在任务完成后自动停止运行。这一表现远超此前发布的 Opus 4 模型，后者曾因能够连续运行 7 小时而成为头条新闻。

Anthropic 将 Claude Sonnet 4.5 称为“现实世界代理、编码和计算机使用的最佳模型”，并强调其在网络安全、金融服务和研究等领域的卓越表现。测试用户之一 Canva 表示，该模型在“复杂、长上下文任务”中表现出色，从代码库工程到产品功能和研究都提供了有力支持。

Anthropic 产品管理负责人 Dianne Penn 在接受《The Verge》采访时透露，Claude Sonnet 4.5 在浏览网页和使用计算机方面的能力比去年 10 月的技术提高了三倍以上。她表示，团队根据早期用户的反馈，在过去一个月内集中精力对模型进行了改进。

Claude.ai 的产品负责人 Scott White 则指出，新模型能够以“首席参谋级别”运行，能够处理诸如安排会议、分析数据仪表板、编写状态更新等复杂任务。虽然 White 和 Penn 尚未尝试使用新模型进行“氛围编码”，但 Penn 表示她在招聘过程中已经利用 Claude Sonnet 4.5 进行深度网络搜索，生成了包含 LinkedIn 配置文件的电子表格，极大提高了招聘效率。

Anthropic 还表示，Claude Sonnet 4.5 的发布将与其他更新结合，帮助开发者编写自己的 AI 代理。该公司在发布中写道：“我们将模型的发布与虚拟机器、内存、上下文管理和多代理支持的访问结合起来，这实质上打包了与 Claude Code 相同的构建模块，使开发者能够构建自己的尖端代理。”

随着 Anthropic、OpenAI 和谷歌等公司不断发布增量更新和功能，AI 技术正逐渐渗透到消费者和企业的日常工作中。几乎每个月，甚至每周，争夺关注和依赖的竞争都在升温。几天前，OpenAI 宣布了 Pulse，这是其最新的 ChatGPT 功能，旨在成为用户早晨例行程序的一部分，并研究与当天相关的主题。

Anthropic 的最新举措无疑将进一步推动 AI 技术在现实世界中的应用，同时也加剧了行业内的竞争。随着 AI 代理和编码能力的不断提升，未来 AI 在企业和个人生活中的作用将更加广泛和深入。

正文完