Nvidia 下一代 GB300 AI 服务器规格增强
媒体泄露了英伟达公司下一代人工智能服务器GB300平台的详细信息,预计该平台将在内存、性能、连接性和散热方面有重大改进。
这家全球最有价值的芯片制造商预计将在其年度 GTC 活动上发布 GB300 AI 服务器,该活动定于 2025 年 3 月举行,但如果它希望在此之前对新平台保密,那么它似乎未能做到这一点。
媒体网站 UDN称,供应链消息人士透露了新服务器的详细规格。据报道,GB300 将采用 Nvidia 最先进的Blackwell 图形处理单元,内存将大幅提升,达到 288 GB 的 HBM3e 随机存取内存,而其前身GB200 AI 服务器只有 192 GB 。
此外,Nvidia 将架构从 8 层改为 12 层,而计算主板现在使用低功耗压缩附加内存模块。
GB300 的核心——Nvidia B300 芯片需要 1,400 瓦的功率,而从 ConnectX 7 切换到 ConnectX 8 后,网络速度也得到了升级,带宽从每秒 800 千兆比特扩展到每秒 1.6 太比特。
报告还提到,与 GB200 相比,FP4 性能提高了 50%。决定使用 FP4(代表每次操作四位浮点精度)显然是人们对 GB300 如此兴奋的主要原因之一。通过转向 FP4 获得的精度降低意味着更快的计算、更少的数据移动和更低的功耗,使其更适合 AI 推理工作负载。
还有其他升级,包括使用 GB300 服务器中即将引入的新“插槽设计”和新的电容器托盘。
UDN 表示,此次升级意味着 GB300 服务器的性能将在“各个方面”优于 GB200。它还补充说,该服务器将成为 Nvidia 的“下一个抢占市场的武器”。
不过,这些改进的规格需要付出相当大的成本,这并不令人意外,GB300 的价格可能会令人难以置信。据 UDN 称,其供应链消息人士估计,GB300 中单个超级电容器的总生产成本将在 20,000 至 25,000 美元之间。由于 GB300 的 NVL72 AI 服务器机柜需要 300 多个超级电容器,亚马逊网络服务公司、微软公司和谷歌有限责任公司等客户预计将支付至少 750 万美元来填充一个超级电容器。
目前尚不清楚 GB300 何时投入量产。其前身 GB200 的产量尚未达到顶峰,预计出货量要到明年年中才会达到顶峰,原因是Blackwell GPU 的后期设计缺陷(据报道导致过热问题)导致生产延迟。
这些挫折意味着 Nvidia 的订单积压了大约一年。这是因为人工智能热潮导致对计算能力的需求旺盛,而 Nvidia 的 GPU 被普遍认为是业内最好的。因此,Nvidia 的市值已上涨超过 3 万亿美元,成为全球最有价值的三家公司之一。
尽管迄今为止的重点一直是企业,但 Nvidia 也将推出其首款消费级 Blackwell GPU,业内人士表示,我们可能会在下个月的消费电子展上听到更多有关该 GPU 的消息。
-
RTX 5090性能测试还不及4090!原因终于找到了
前不久我们报道了关于NVIDIA新一代RTX 50系列在PassMark的测试排行榜上还不如上代产品,比如RTX 5090就没能超过RTX 4090。而PassMark的调查揭示了这一问题的根源:NV
-
NVIDIA确认 RTX 5090和5070 Ti存在ROP单元缺失!仅0.5%受影响
日前NVIDIA确认,部分RTX 5090、RTX 5090D和RTX 5070 Ti显卡存在ROP光栅单元缺失的问题,不过表示这一问题仅影响不到0.5%的显卡。TechPowerUP此前在测试索泰R
-
RTX 5070 Ti还没上市 已经有人买到手:首发直逼8000元
现在的经销商是不是有点太不靠谱了……无论是Intel Arc B500系列,还是NVIDIA RTX 50系列,都多次发生开卖之前就有人收到货的事情,现在轮到了RTX 5070 Ti。Reddit上一
关注公众号:拾黑(shiheibook)了解更多
友情链接:
关注数据与安全,洞悉企业级服务市场:https://www.ijiandao.com/
安全、绿色软件下载就上极速下载站:https://www.yaorank.com/