CANN/cann-recipes-infer:MiniMax-M2.5 MXFP4 vLLM昇腾推理
MiniMax-M2.5 MXFP4 for vLLM-Ascend 【免费下载链接】cann-recipes-infer 本项目针对LLM与多模态模型推理业务中的典型模型、加速算法,提供基于CANN平台的优化样例 项目地址: https://gitcode.com/cann/cann-recipes-infer
项目简介
本项目提供 MiniMax-M2…
2026/7/4 8:44:58