Qwen3.5-397B-A17B-FP8 完整 Benchmark 总结
Qwen3.5-397B-A17B-FP8 完整 Benchmark 总结 一、部署配置 项目 值 模型 Qwen3.5-397B-A17B-FP8 架构 MoE(512 experts, 10/token, 60 层, 48 linear + 12 full attn) 量化 FP8 上下文 256K(默认),优化后限 65K 硬件 4H100 8卡(32 GPU total) TP 8(单节点 8 卡一个 TP …
2026/7/6 5:21:37