DeepEP 代码阅读指南

📅 2026/6/29 18:03:37
DeepEP 代码阅读指南
DeepEP 代码阅读指南第一阶段:理解整体架构(30 分钟)先看顶层结构,建立心智模型:deep_ep/ ← Python API(用户入口) ├── __init__.py ← 导出 Buffer, ElasticBuffer, EPHandle 等 ├── buffers/ │ ├── legacy.py ← V1 Buffer(基于 NVSHMEM) │ └── elastic.py ← V2 ElasticBuffer(基于 NCCL Gin,推荐) ├── utils/ │ ├── refs.py ← 纯 Python 参考实现(最容易理解逻辑) │ ├── comm.py ← NCCL 通信管理器 │ ├── event.py ← EventOverlap(计算通信重叠) │ └── gate.py ← top-k routing 工具 csrc/ ← C++/CUDA 底层 ├── python_api.cpp ← pybind11 绑定 ├── elastic/ ← V2 C++ 实现 ├── kernels/ │ ├── backend/ ← NCCL / NVSHMEM / CUDA Driver 后端 │ └── elastic/ ← V2 kernel launcher(JIT 入口) ├── jit/ ← NVRTC 运行时编译系统 └── legacy/