美国政府限制Anthropic新AI模型,“越狱”问题引多方争议或损美实验室竞争力

📅 2026/6/16 11:16:59
美国政府限制Anthropic新AI模型,“越狱”问题引多方争议或损美实验室竞争力
AI模型受限事件上周末美国政府对新发布的AI模型Mythos 5和Fable 5的使用范围实施全面限制Anthropic随即暂停用户对这两款模型的访问权限。周五下午联邦政府告知Anthropic发现“越狱”Fable 5的方法绕过了其设置的限制。Anthropic首次发布Mythos时因挖掘网络安全漏洞能力仅向部分政府机构和技术专业人员开放。美国政府实施出口管制Anthropic需暂停外国公民对两款模型的访问权限唯一办法是完全关闭。Anthropic认为“越狱”情况不足以支持全面行动若广泛应用此标准可能“从根本上阻碍”前沿AI模型发展。Anthropic称政府行动未遵循相关原则其代表拒绝在声明外发表评论美国商务部代表未回应置评请求。据报道Anthropic派员工前往华盛顿与特朗普政府谈判周六其领导层与商务部长霍华德·卢特尼克和国家网络安全主任肖恩·凯恩斯克罗斯进行数小时电话沟通。AI安全与“越狱”问题这并非Anthropic首次与华盛顿在AI模型问题上冲突。今年早些时候国防部将其列为“供应链风险”因其限制Claude AI模型用于完全自主武器或大规模国内监控而五角大楼希望用于“所有合法目的”。总统科学技术顾问委员会联合主席、特朗普政府前“AI和加密货币沙皇”大卫·萨克斯否认冲突关联称政府认为问题易解决责任在Anthropic。政府不认同Anthropic“越狱”问题不严重的说法指出其致力于AI安全却优先考虑消费级模型而非安全。康奈尔大学AI战略与创新执行董事艾哈姆·布彻表示问题难解决“越狱”情况不意外因所有模型都可能被“越狱”。所谓“越狱”是用户诱导模型绕过安全措施布彻举例说明。随着AI模型复杂开发者加强防范但仍是持久战。Anthropic发布Fable 5时采取额外预防措施要求用户允许存储交互记录30天这虽非常规可能让公司付出代价但可识别并修复潜在“越狱”问题。布彻认为政府要求修补漏洞是对技术本质误解因总会有新漏洞出现。达到Mythos级别的模型并非遥不可及Anthropic虽为事件焦点但并非唯一有编码和网络安全能力模型的公司。与OpenAI的GPT - 5.5相比Mythos在发现漏洞方面不一定更出色。布彻表示模型在网络安全方面出色是因编码和数学易扩展写作等方面改进速度放缓数学和编码能力仍呈指数级提升这适用于所有AI实验室。Anthropic率先推出相关模型但其竞争对手不会落后太远包括美国公司和中国开发者。布彻称其他模型开发者在编码方面达到Mythos级别并非遥不可及。2025年7月唐纳德·特朗普总统公布AI行动计划将“在AI竞赛中战胜中国”列为优先事项但Anthropic的Claude Mythos模型带来的网络安全风险促使政府采取更激进行动。竞争激烈特朗普政府强调美国公司领先中国的重要性上周五暂停Fable和Mythos使用可能损害美国实验室竞争力出口管制限制外国公民使用和访问而这些人对下一代模型开发可能至关重要。布彻认为会减缓模型开发速度。华盛顿倾向对先进AI模型实施更多监管但转变混乱且缺乏协调。特朗普政府去年公布的AI行动计划称限制监管对确保“全球AI主导地位”重要但Mythos让白宫震惊。本月早些时候特朗普总统签署行政命令要求开发者发布可能有安全风险的前沿模型前让联邦政府审查。民主与技术中心政策副总裁萨米尔·贾恩表示审查过程自愿性质持续时间短。贾恩认为网络安全风险存在政府有必要保护系统但上周五行动随意不透明缺乏明确理由和程序不清楚政府撤下模型的权力依据讨论私下进行。贾恩还指出涉及第一修正案问题政府监管时需考虑言论和表达自由既要考虑Anthropic权利也要考虑用户权利强调监管措施要符合法治原则。