Anthropic 最新 Claude 模型：AI 领域的新标杆？

173次阅读

共计 1447 个字符，预计需要花费 4 分钟才能阅读完成。

Anthropic 的 Claude AI 近日发布了一款新模型，能够在回应请求时进行更长时间和更深入的“思考”。

新的扩展思考模式可通过 Claude 网站和开发者 API 访问，但并非免费提供。尽管 Claude 3.7 Sonnet 对所有用户开放，但只有 Pro 或 Team 订阅者才能使用扩展思考选项。

Anthropic 在周一的公告中表示，扩展模式在处理复杂的数学和编码问题以及前端 Web 开发方面表现尤为出色。在这种模式下，Claude 在提供答案之前会进行“自我反思”。这种深入的思考过程使其在处理涉及数学、物理、指令遵循和编码的任务时更为得心应手，并在解决问题的过程中展示其步骤。

Anthropic 还强调，Claude 3.7 Sonnet 在早期测试中表现优异。有网站发现，新模型在处理复杂代码库和使用高级工具方面有显著改进。另一网站则成功使用 Claude 从零开始构建了复杂的 Web 应用和仪表板，这一任务对其他模型来说颇具挑战。在第三次评估中，Claude 生成的代码不仅设计质量高，且错误率显著降低。

在代理工具的测试中，Claude 3.7 Sonnet 的表现不仅超越了其前代版本 3.5/3.6，还领先于 OpenAI 的 o1 和 DeepSeek R1。

Anthropic 在公告中表示：“我们开发 Claude 3.7 Sonnet 的理念与市场上其他推理模型不同。正如人类使用单一大脑进行快速反应和深度思考一样，我们认为推理应该是前沿模型的综合能力，而不是完全独立的模型。这种统一的方法也为用户创造了更无缝的体验。”

如果你是 Pro 或 Team 订阅者，可以尝试 Claude 的新扩展模式。访问网站，点击模型的下拉菜单，确保选择 Claude 3.7 Sonnet，并将思考模式从“正常”更改为“扩展”。输入并提交你的请求。例如，你可以要求 Claude 创建一个比较 Anthropic、OpenAI 和 Google 提供的不同 AI 模型的网页。

在生成过程中，Claude 会逐行显示 HTML 和 CSS 代码。完成后，你可以以 HTML 模式或预览模式查看页面。唯一的限制是，Claude 的信息仅更新至 2024 年 10 月，因此无法了解此后的实时事件和信息。

Anthropic 最新 Claude 模型：AI 领域的新标杆？