国内首次!百度智能云成功点亮昆仑芯三代万卡集群

业界 来源:快科技 2025-02-05 11:20:37

近日,百度智能云成功点亮了昆仑芯三代万卡集群,这也是国内首个正式点亮的自研万卡集群。

据了解,百度通过自研芯片和大规模集群的建设,不仅解决了自身算力供应的问题,还为整个行业提供了新的思路和方向。

随着国产大模型的兴起,万卡集群逐渐从“单任务算力消耗”到“集群效能最大化”过渡,通过模型优化、有效训练率提升、动态资源分配等手段,智能调度任务,将训练、微调、推理任务混合部署,从而提升集群综合利用率,降低单位算力成本。

让人眼前为之一亮的是,在24年9月升级的百度百舸AI异构计算平台4.0,也在万卡集群的建设中发挥了至关重要的作用。

首先百舸4.0构建了十万卡级别的超大规模HPN高性能网络,针对跨地域通信中的高延迟问题,通过优化的拓扑结构、多路径负载均衡策略及通信策略,实现了几十公里的跨地域通信。

其次在通信效率上,百舸通过先进的拥塞控制算法和集合通信算法策略,实现了完全无阻塞,并通过10ms级别超高精度网络监控,保障了网络的稳定性。

另外在多芯混训方面,百舸展现了强大的资源整合能力。当业务提交工作负载时,百舸可自动进行芯片选型,依据集群剩余的芯片资源,选择性价比最高的芯片来运行任务,从而最大化地利用集群的剩余资源,实现高达95%的万卡多芯混合训练效能。

此外,在集群稳定性方面,百舸提供了全面的故障诊断手段,能够快速自动侦测到导致训练任务异常的节点故障。

值得关注的是,日前,花旗银行曾发布研报表示,DeepSeek、百度等中国模型展现出高效和低成本优势,将有助于加速全球AI应用开发,并在全球引发更多技术创新,推动2025年人工智能应用的拐点。

另外中国工程院院士、清华大学计算机系教授郑纬民也表示,当下构建国产自主万卡系统充满挑战,但"至关重要"

延伸阅读
  • 百度智能云上线DeepSeek-R1/V3:还有限时免费

    今天百度智能云正式宣布DeepSeek-R1和DeepSeek-V3模型已在百度智能云千帆平台上架,并推出了极具竞争力的超低价格方案,同时提供2周免费服务。根据官方公布的信息,DeepSeek-R1模

  • 百度智能云CDN域名被攻击者盗刷流量导致帐号大量欠费

    最近,国内大量CDN被刷事件,已经有大量站长、CDN服务商中招了,为此阿里云、腾讯云都出了解决办法,百度智能云也在被刷行列,百度还特地发了短信提醒:这些CDN服务商都没有对被刷的流量进行补偿,提交工单

  • 百度要把全部产品用大模型重做一遍 开始研发药物了

    近日,百度智能云、NVIDIA联合智药邦,在《中国AI药物研发大会》期间推出《AI+大模型,生命科学的智能化进阶之道》专场。百度智能云生命科学行业解决方案总监徐强表示,AI大模型与生命科学领域融合发展

关注公众号:拾黑(shiheibook)了解更多

友情链接:

关注数据与安全,洞悉企业级服务市场:https://www.ijiandao.com/
安全、绿色软件下载就上极速下载站:https://www.yaorank.com/

公众号 关注网络尖刀微信公众号
随时掌握互联网精彩
赞助链接