DeepSeek第二炸!开源首个用于MoE模型训练通信库
DeepSeek 的“开源周”活动今日已经来到第二天,今天发布的是首个开源的用于 MoE 模型训练和推理的 EP 通信库 ——DeepEP。
官方表示其具备如下特征:
高效优化的全到全通信方式
支持节点内外通信,兼容 NVLink 和 RDMA 技术
提供高吞吐量的内核,提升训练和推理前期填充效率
提供低延迟内核,优化推理解码速度
完全支持 FP8 数据格式调度
提供灵活的 GPU 资源管理,支持计算与通信的重叠执行
据介绍,DeepEP 是一款专为混合专家(MoE)和专家并行(EP)设计的通信库,提供了高吞吐量和低延迟的 all-to-all GPU 内核,常用于 MoE 派发和合并操作。该库还支持低精度计算,包括 FP8。
为了与 DeepSeek-V3 论文中提出的组限制门控算法兼容,DeepEP 提供了一些针对不对称带宽转发优化的内核,比如将数据从 NVLink 域转发到 RDMA 域。这些优化的内核能够提供高吞吐量,适合用于训练和推理的预填充任务,同时支持 SM(流式多处理器)数量控制。
对于延迟敏感型的推理解码任务,DeepEP 提供了一套低延迟内核,采用纯 RDMA 技术以最大程度减少延迟。此外,该库还采用了一种基于 Hook 的通信与计算重叠方法,不会占用任何 SM 资源。
-
Lisa演唱会丢掉粉丝送的labubu 表情还一脸嫌弃
7月5日,在BLACKPINK首尔高阳演唱会上,有粉丝向台上的Lisa抛出一个Labubu,但Lisa在接到Labubu后随即丢回台下,还露出了嫌弃的表情。熟悉的粉丝一定都知道,Lisa是POPMAR
-
苹果iPhone 17 Air机模上手:引领轻薄手机新趋势
消息源 @MajinBuOfficial 昨日(7 月 8 日)在 X 平台分享了一段视频,展示了黑色版苹果 iPhone 17 Air 机模。苹果供应链分析师郭明錤此前曝料,iPhone 17 Ai
-
不愧是模特!《生化9》脸模新图:穿比基尼身材超辣!
英国美女模特Roya Athina确认参与了《生化危机9:安魂曲》的面部捕捉工作,但她本人表示并不知道自己饰演的是哪一个角色,她在社媒写道:“澄清一下,其实我并不知道这款游戏的剧情,也不清楚我的面部特
关注公众号:拾黑(shiheibook)了解更多
友情链接:
关注数据与安全,洞悉企业级服务市场:https://www.ijiandao.com/
安全、绿色软件下载就上极速下载站:https://www.yaorank.com/
- Shopex与Ecshop的支付方式支持情况对比
- 马斯克拟收购OpenAI 能成吗
- ChatGPT Search面向所有用户开放 无需账户或登录即可搜索
- 苹果有望本周推出iCloud新服务!可邀请用户参加活动
- 轻薄、续航、性能全都有!联想ThinkPad X1 Carbon Aura AI 2025开启预约
- 日本男子新加坡性侵学生被追加鞭刑
- ColorOS 15 Beta版即将内测:OPPO Find X7首发尝鲜
- 金龙机电:公司控股股东变更为宁瑞沃格 实际控制人变更为赵宝泽
- 拼多多发布2024年Q1财报:营收868亿元 同比大涨131%
- 通讯专家质疑iPhone 5G信号造假!运营商确认实锤:北京10号线没5G基站
- 网友质疑护士穿包臀裙上班,称“百害而无一利” 医院回应
- 2023春节档预售票房破亿:《流浪地球2》排片率第一

随时掌握互联网精彩