2月25日,DeepSeek官宣,今日开源代码库为DeepEP,它是首个用于 MoE 模型训练和推理的开源EP通信库。

  特点有:高效的全员沟通;节点内和节点间均支持 NVLink和RDMA;用于训练和推理预填充的高吞吐量内核;用于推理解码的低延迟内核;原生 FP8 调度支持;灵活的GPU资源控制,实现计算-通信重叠。

CFF20LXzkOxqN7xcquf4vibBRE5ic9XjyCsRzkcXhzaaJibYETpNXwSiaibcPfnnibiaeQkwVUQWEH7ZXH09OHLkzyXnQ.jpg