(2025-2-28热点)-DeepEP开源库发布
2月25日,DeepSeek官宣,今日开源代码库为DeepEP,它是首个用于 MoE 模型训练和推理的开源EP通信库。
特点有:高效的全员沟通;节点内和节点间均支持 NVLink和RDMA;用于训练和推理预填充的高吞吐量内核;用于推理解码的低延迟内核;
原生 FP8 调度支持;灵活的GPU资源控制,实现计算-通信重叠。
本文经用户投稿或网站收集转载,如有侵权请联系本站。
2月25日,DeepSeek官宣,今日开源代码库为DeepEP,它是首个用于 MoE 模型训练和推理的开源EP通信库。
特点有:高效的全员沟通;节点内和节点间均支持 NVLink和RDMA;用于训练和推理预填充的高吞吐量内核;用于推理解码的低延迟内核;
原生 FP8 调度支持;灵活的GPU资源控制,实现计算-通信重叠。