Anthropic发布Claude Sonnet 5大语言模型，编程能力与安全性升级

📅 2026/7/2 2:07:27

Anthropic今日正式发布了Claude Sonnet 5这是一款中端大语言模型在多个维度上超越了前代产品。该模型将成为Anthropic旗下Claude聊天服务消费级套餐的默认选项。Anthropic的商用大语言模型产品线分为三个系列入门级的Haiku系列、中端的Sonnet系列以及高端的Opus系列。今年4月该公司推出了两款能力更强的大语言模型Mythos 5和Fable 5性能甚至超越了Opus系列但目前尚未向大众开放。在编程能力方面Anthropic使用SWE-Bench Pro和Terminal-Bench 2.1两项基准测试对Sonnet 5进行了评估。与前代产品相比该模型的得分分别提升了5.1%和13.4%。不过OpenAI旗下同级别竞品GPT-5.6 Terra在Terminal-Bench 2.1上的表现仍领先Sonnet 5约4%。Anthropic还对新模型在其他领域的表现进行了测试。在涵盖44个职业知识工作任务的GDPval-AA v2基准测试中Sonnet 5获得了1618分而上一代Sonnet 4.5仅得1395分。Sonnet 5输出质量提升的一个重要原因在于其自主性更强。据Anthropic介绍参与发布前测试的用户反馈该模型有时会在未收到指令的情况下主动对输出结果进行二次核查。此外Sonnet 5还能够处理前代模型难以应对的复杂任务。大语言模型自主性的增强在某些场景下可能带来网络安全风险。Anthropic表示Sonnet 5在应对此类风险方面优于Sonnet 4.6尤其是在拦截恶意请求和提示词注入攻击方面表现更为出色。所谓提示词注入攻击是指隐藏在大语言模型所分析数据中的恶意指令。新模型内置了相应的防护机制可阻止黑客利用其发动网络攻击。据Anthropic透露由于该模型无法生成可实际运行的漏洞利用代码因此其带来的网络安全风险十分有限。Sonnet 5现已成为Claude聊天服务免费版和面向消费者的Pro套餐的默认模型未来还将向Max、Team和企业版套餐用户开放。开发者则可通过Anthropic的应用程序编程接口调用该模型。自9月起Sonnet 5的定价为每百万输入Token 3美元、每百万输出Token 15美元略高于OpenAI的中端产品Terra。Anthropic用户即将获得另外两款新模型的访问权限。本月早些时候该公司发布了旗舰大语言模型Mythos 5及其精简版Fable 5后者内置了更严格的防护机制可屏蔽潜在风险提示词。Mythos 5和Fable 5发布数日后美国政府对这两款模型实施了出口管制Anthropic随即暂停了相关模型的推广。该公司今日宣布上述管制已被解除相关访问权限将于周三起逐步恢复。Anthropic计划将Fable 5向大众广泛开放而Mythos 5则仅向有限数量的受信任机构提供访问权限。QAQ1Claude Sonnet 5的编程能力提升有多大A根据Anthropic的测试Claude Sonnet 5在SWE-Bench Pro基准测试上比前代提升了5.1%在Terminal-Bench 2.1上提升了13.4%。不过OpenAI的同级别竞品GPT-5.6 Terra在Terminal-Bench 2.1上仍领先Sonnet 5约4%。Q2Claude Sonnet 5的安全防护机制有哪些改进AClaude Sonnet 5在安全性方面有明显提升能更有效地拦截恶意请求和提示词注入攻击。模型内置了防护机制阻止黑客用其发动网络攻击且由于无法生成可实际运行的漏洞利用代码其整体网络安全风险被控制在较低水平。Q3Claude Sonnet 5的定价是多少如何获取访问权限A自9月起Claude Sonnet 5的定价为每百万输入Token 3美元、每百万输出Token 15美元。该模型现已成为Claude免费版和Pro套餐的默认模型同时也将向Max、Team和企业版套餐开放。开发者可通过Anthropic的API接口调用该模型。

新闻详情

相关阅读

如果在一个函数中的复合语句中定义了一个变量，则该变量( )。

Agentic RAG 从入门到实战：让 RAG 拥有“自我纠错”能力

打破音乐枷锁：3个维度重新定义数字音乐所有权的开源革命

实操笔记：vscode+opencode+deepseek

2026年实用降AIGC网站：亲测AI率从90%降至4%的稳妥方案

大路灯护眼灯是智商税吗？大路灯高质量牌子分享，硬核机型抢先看

广东省工程技术研究中心认定对企业有什么好处?如何申报

2026年AI论文工具核心能力速览

紧急提醒！登报挂失去哪里办理？登报挂失有法律效应吗？

Selenium元素定位全解析：从八大方法到实战策略

BurpSuite Cluster Bomb模式深度避坑指南：从原理到实战的完整爆破策略

UnblockNeteaseMusic终极教程：3分钟解锁网易云音乐灰色歌曲的完整方案

管理者的六个层次

华为OD机试2025C卷-座位调整[100分]（ Java _ Python3 _ C++ _ C语言 _ JsNode _ Go）实现100%通过率

CrabCode v1.0.7与v1.0.8 更新速览！

FAE放射组学分析工具：医学影像特征探索的完整解决方案

基于Dify与DeepSeek构建私有知识库问答系统实战指南

餐饮老板必看：扫码点餐小程序3步搞定，别再让顾客干等了！