Anthropic发布Claude Sonnet 5大语言模型,编程能力与安全性升级

📅 2026/7/2 2:07:27
Anthropic发布Claude Sonnet 5大语言模型,编程能力与安全性升级
Anthropic今日正式发布了Claude Sonnet 5这是一款中端大语言模型在多个维度上超越了前代产品。该模型将成为Anthropic旗下Claude聊天服务消费级套餐的默认选项。Anthropic的商用大语言模型产品线分为三个系列入门级的Haiku系列、中端的Sonnet系列以及高端的Opus系列。今年4月该公司推出了两款能力更强的大语言模型Mythos 5和Fable 5性能甚至超越了Opus系列但目前尚未向大众开放。在编程能力方面Anthropic使用SWE-Bench Pro和Terminal-Bench 2.1两项基准测试对Sonnet 5进行了评估。与前代产品相比该模型的得分分别提升了5.1%和13.4%。不过OpenAI旗下同级别竞品GPT-5.6 Terra在Terminal-Bench 2.1上的表现仍领先Sonnet 5约4%。Anthropic还对新模型在其他领域的表现进行了测试。在涵盖44个职业知识工作任务的GDPval-AA v2基准测试中Sonnet 5获得了1618分而上一代Sonnet 4.5仅得1395分。Sonnet 5输出质量提升的一个重要原因在于其自主性更强。据Anthropic介绍参与发布前测试的用户反馈该模型有时会在未收到指令的情况下主动对输出结果进行二次核查。此外Sonnet 5还能够处理前代模型难以应对的复杂任务。大语言模型自主性的增强在某些场景下可能带来网络安全风险。Anthropic表示Sonnet 5在应对此类风险方面优于Sonnet 4.6尤其是在拦截恶意请求和提示词注入攻击方面表现更为出色。所谓提示词注入攻击是指隐藏在大语言模型所分析数据中的恶意指令。新模型内置了相应的防护机制可阻止黑客利用其发动网络攻击。据Anthropic透露由于该模型无法生成可实际运行的漏洞利用代码因此其带来的网络安全风险十分有限。Sonnet 5现已成为Claude聊天服务免费版和面向消费者的Pro套餐的默认模型未来还将向Max、Team和企业版套餐用户开放。开发者则可通过Anthropic的应用程序编程接口调用该模型。自9月起Sonnet 5的定价为每百万输入Token 3美元、每百万输出Token 15美元略高于OpenAI的中端产品Terra。Anthropic用户即将获得另外两款新模型的访问权限。本月早些时候该公司发布了旗舰大语言模型Mythos 5及其精简版Fable 5后者内置了更严格的防护机制可屏蔽潜在风险提示词。Mythos 5和Fable 5发布数日后美国政府对这两款模型实施了出口管制Anthropic随即暂停了相关模型的推广。该公司今日宣布上述管制已被解除相关访问权限将于周三起逐步恢复。Anthropic计划将Fable 5向大众广泛开放而Mythos 5则仅向有限数量的受信任机构提供访问权限。QAQ1Claude Sonnet 5的编程能力提升有多大A根据Anthropic的测试Claude Sonnet 5在SWE-Bench Pro基准测试上比前代提升了5.1%在Terminal-Bench 2.1上提升了13.4%。不过OpenAI的同级别竞品GPT-5.6 Terra在Terminal-Bench 2.1上仍领先Sonnet 5约4%。Q2Claude Sonnet 5的安全防护机制有哪些改进AClaude Sonnet 5在安全性方面有明显提升能更有效地拦截恶意请求和提示词注入攻击。模型内置了防护机制阻止黑客用其发动网络攻击且由于无法生成可实际运行的漏洞利用代码其整体网络安全风险被控制在较低水平。Q3Claude Sonnet 5的定价是多少如何获取访问权限A自9月起Claude Sonnet 5的定价为每百万输入Token 3美元、每百万输出Token 15美元。该模型现已成为Claude免费版和Pro套餐的默认模型同时也将向Max、Team和企业版套餐开放。开发者可通过Anthropic的API接口调用该模型。