美团开源 1.6 万亿参数 LongCat-2.0,国产算力加持多场景协作更高效

📅 2026/6/30 19:58:18
美团开源 1.6 万亿参数 LongCat-2.0,国产算力加持多场景协作更高效
【导语美团正式发布并开源总参数量达 1.6 万亿的 LongCat-2.0 语言模型。该模型多项架构改进能力跃升用国产算力集群完成训练在长程任务及多元场景表现出色。】1.6 万亿参数量级国产算力铸就模型训练美团开源的 LongCat-2.0 是一个总参数量达 1.6 万亿、每个 token 激活约 480 亿参数的 MoE 语言模型。其完整训练流程与大规模部署均使用国产算力集群预训练在 5 万余国产算力芯片上耗时月余消费超 35 万亿 tokens且全程无回滚、无不可恢复的 loss 突刺。稀疏注意力与 N-gram 模块架构改进提升性能为强化长程任务能力团队引入 LongCat 稀疏注意力机制在数千亿 tokens 的百万上下文长度数据上训练 LongCat-2.0。该机制由 DeepSeek 稀疏注意力演进而来引入更轻量化索引器无损质量加速长上下文处理。同时加入 N-gram Embedding 模块通过 N-gram token 组合将 embedding 空间扩展超 100 倍充分建模局部上下文信息提升 token 级表示能力。适配主流 Harness多元场景协作体验升级LongCat-2.0 深度适配 Claude Code、OpenClaw、Hermes 等主流 Harness在代码理解、仓库级修改、自动化任务执行及 Agentic Workflow 等多元场景中表现出色能为开发者带来更稳定、更高效的智能协作体验。对比领先闭源模型多维度展现实力将 LongCat-2.0 在代码、通用 Agent 与基础能力等维度和领先闭源模型对比除标注 * 者外所有分数均在统一评测框架下由内部测得展现出其在模型能力上的竞争力。编辑观点LongCat-2.0 的发布与开源是技术突破国产算力的应用值得肯定架构改进提升性能多场景适配有潜力未来在 AI 领域有望发挥更大作用。