美团1.6万亿模型用国产芯片跑出来的,性能还超了GPT-5.5和Claude

📅 2026/7/1 5:50:58
美团1.6万亿模型用国产芯片跑出来的,性能还超了GPT-5.5和Claude
AI圈又炸了一个重磅消息。美团正式发布LongCat-2.0——1.6万亿参数MoE架构原生支持1M超长上下文预训练数据超过30T tokens。但最炸的不是参数是训练方式。LongCat-2.0是业界第一个在五万张国产算力卡上完成从预训练到推理全流程的万亿参数大模型。全程跑在国产芯片上从训练到推理没有用一块英伟达A100或H100。这意味着什么国产算力第一次真正扛住了万亿参数模型的训练压力。五万张国产卡跑通了万亿模型LongCat团队从2023年开始啃国产算力这块硬骨头。从千卡起步逐步攻克算子适配、通信优化、分布式稳定性。三年的时间终于把五万张国产卡集群跑通了。几个关键突破通过HCCL异常处理、弹性扩缩卡和自动故障恢复月均日故障率降低70%以上通过流水线调度、显存优化和算子级控核训练MFU提升1.5倍稳态日吞吐超过1T tokens/day全程未出现不可逆的loss尖刺与回滚国产芯片虽然单卡性能不如英伟达最顶尖的产品但计算正确性和精度已经足够满足需求可以支撑万亿参数模型的稳定训练。这不是实验室里的单次验证是五万卡集群上的规模化生产。性能不只是“能用”是“能打”参数大不等于好用。但LongCat-2.0的性能数据确实能打。在SWE-bench Pro编程基准考察深层工程能力上LongCat-2.059.5分GPT-5.558.6分Claude Opus 4.657.3分Gemini 3.1 Pro54.2分超过了GPT-5.5和Claude Opus 4.6。在SWE-bench Multilingual上得分77.3与Claude Opus 4.6的77.8几乎持平。在Terminal-Bench 2.1上得分70.8体现了在真实运维与开发终端任务中的稳定执行与纠错能力。架构层面也有看点LSA稀疏注意力机制处理长文本时计算量从平方级降至线性级零计算专家机制简单Token不消耗算力复杂Token自动获得更多计算资源MOPD架构融合Agent、Reasoning、Interaction三组专家能力全球开发者用脚投票LongCat-2.0预览版此前以匿名方式接入了全球最大的大模型API路由平台OpenRouter。截至6月底总调用量已跻身全球前三。在Hermes、Claude Code、OpenClaw等Agent场景下月调用量分列全球第一、第二和第三位。全球开发者用实际调用行为给出了判断——LongCat-2.0已经进入“值得在生产环境使用”的区间。社区反馈显示在工具调用、复杂指令执行等Agent核心能力方面LongCat-2.0-Preview接近Claude Opus 4.6。最关键的一点即将开源美团宣布将于近期在多平台同步开源Infra框架、推理引擎、模型参数等核心技术。这意味着开发者可以研究万亿参数模型的训练框架在自己的场景中部署和微调基于国产算力构建自己的应用从GLM-5.2到豆包2.1到LongCat-2.0国产模型正在用三条不同的路径——开源、闭源API、国产算力全栈——同时证明一件事国产AI已经不只是“能用”了是“能打”了。 你会试LongCat-2.0吗国产算力万亿模型你觉得能追上Claude吗欢迎在评论区聊聊你的看法。本文基于美团LongCat-2.0发布会公开信息撰写。勇哥AI实验室关注AI怎么用。