美团1.6万亿模型用国产芯片跑出来的，性能还超了GPT-5.5和Claude

📅 2026/7/1 5:50:58

AI圈又炸了一个重磅消息。美团正式发布LongCat-2.0——1.6万亿参数MoE架构原生支持1M超长上下文预训练数据超过30T tokens。但最炸的不是参数是训练方式。LongCat-2.0是业界第一个在五万张国产算力卡上完成从预训练到推理全流程的万亿参数大模型。全程跑在国产芯片上从训练到推理没有用一块英伟达A100或H100。这意味着什么国产算力第一次真正扛住了万亿参数模型的训练压力。五万张国产卡跑通了万亿模型LongCat团队从2023年开始啃国产算力这块硬骨头。从千卡起步逐步攻克算子适配、通信优化、分布式稳定性。三年的时间终于把五万张国产卡集群跑通了。几个关键突破通过HCCL异常处理、弹性扩缩卡和自动故障恢复月均日故障率降低70%以上通过流水线调度、显存优化和算子级控核训练MFU提升1.5倍稳态日吞吐超过1T tokens/day全程未出现不可逆的loss尖刺与回滚国产芯片虽然单卡性能不如英伟达最顶尖的产品但计算正确性和精度已经足够满足需求可以支撑万亿参数模型的稳定训练。这不是实验室里的单次验证是五万卡集群上的规模化生产。性能不只是“能用”是“能打”参数大不等于好用。但LongCat-2.0的性能数据确实能打。在SWE-bench Pro编程基准考察深层工程能力上LongCat-2.059.5分GPT-5.558.6分Claude Opus 4.657.3分Gemini 3.1 Pro54.2分超过了GPT-5.5和Claude Opus 4.6。在SWE-bench Multilingual上得分77.3与Claude Opus 4.6的77.8几乎持平。在Terminal-Bench 2.1上得分70.8体现了在真实运维与开发终端任务中的稳定执行与纠错能力。架构层面也有看点LSA稀疏注意力机制处理长文本时计算量从平方级降至线性级零计算专家机制简单Token不消耗算力复杂Token自动获得更多计算资源MOPD架构融合Agent、Reasoning、Interaction三组专家能力全球开发者用脚投票LongCat-2.0预览版此前以匿名方式接入了全球最大的大模型API路由平台OpenRouter。截至6月底总调用量已跻身全球前三。在Hermes、Claude Code、OpenClaw等Agent场景下月调用量分列全球第一、第二和第三位。全球开发者用实际调用行为给出了判断——LongCat-2.0已经进入“值得在生产环境使用”的区间。社区反馈显示在工具调用、复杂指令执行等Agent核心能力方面LongCat-2.0-Preview接近Claude Opus 4.6。最关键的一点即将开源美团宣布将于近期在多平台同步开源Infra框架、推理引擎、模型参数等核心技术。这意味着开发者可以研究万亿参数模型的训练框架在自己的场景中部署和微调基于国产算力构建自己的应用从GLM-5.2到豆包2.1到LongCat-2.0国产模型正在用三条不同的路径——开源、闭源API、国产算力全栈——同时证明一件事国产AI已经不只是“能用”了是“能打”了。你会试LongCat-2.0吗国产算力万亿模型你觉得能追上Claude吗欢迎在评论区聊聊你的看法。本文基于美团LongCat-2.0发布会公开信息撰写。勇哥AI实验室关注AI怎么用。

新闻详情

相关阅读

前端测试质量保障

如何快速获取网盘直链：LinkSwift下载助手完整使用教程

深度学习项目复现全攻略：从环境搭建到结果验证的工程实践

仅限内部技术团队流通：VMware NAT端口转发黄金配置模板（含Windows/Linux双宿主环境、IPv6兼容性补丁及SELinux绕过方案）

穿山甲GroMore聚合变现接入【安卓】

制造业工控终端安全实战：120+台设备如何通过苹果供应链安全审核？

新手避坑指南：从ENA下载数据到QIIME2 2023.5版完成16S扩增子分析全流程

别再死磕LangChain了！用Dify零代码搞定RAG应用，5分钟搭建你的第一个AI客服

别再死记硬背时序图了！用Arduino+AT24C02实战，5分钟搞懂I2C通信核心

FAE放射组学分析工具：医学影像特征探索的完整解决方案

基于Dify与DeepSeek构建私有知识库问答系统实战指南

餐饮老板必看：扫码点餐小程序3步搞定，别再让顾客干等了！

管理者的六个层次

华为OD机试2025C卷-座位调整[100分]（ Java _ Python3 _ C++ _ C语言 _ JsNode _ Go）实现100%通过率

CrabCode v1.0.7与v1.0.8 更新速览！

FAE放射组学分析工具：医学影像特征探索的完整解决方案

基于Dify与DeepSeek构建私有知识库问答系统实战指南

餐饮老板必看：扫码点餐小程序3步搞定，别再让顾客干等了！