share_log

英伟达最受欢迎的产品,暂停开发!

半导体行业观察 ·  Oct 2 11:06

如果您希望可以时常见面,欢迎标星 收藏哦~

来源:内容编译自tomshardware,谢谢。

据知名分析师郭明錤在Medium上的报道,英伟达已暂停开发基于GB200的双机架72路NVL36×2,以集中资源开发单机架的NVL72和NVL36。这位分析师以其内部消息来源的准确性而闻名。单机架的NVL36和NVL72机器将按计划上市,英伟达此举的原因据称是由于资源有限以及客户的偏好。然而,早前的报道显示,双机架的NVL36×2被认为是英伟达客户中最受欢迎的选择。

最初,英伟达计划开发三款基于Blackwell GPU的GB200型号,用于AI和高性能计算(HPC)工作负载,分别为NVL36、NVL72和NVL36×2。然而,管理所有三个项目变得具有挑战性,尤其是在同时开发两个不同的72 GPU版本(NVL72和NVL36×2)的情况下。因此,英伟达现在只专注于NVL72和NVL36。

英伟达的GB200 NVL72机架包含18个计算托盘和9个NVSwitch托盘(18个NVSwitch ASIC),每个托盘有两块Bianca板,每块板上有一个Grace CPU和两个Blackwell GPU。这是英伟达最强大的产品,但也是功耗最高的解决方案,耗电约120kW。

根据SemiAnalysis的预计,由于极端的功率和密度需求(典型机架功率为12kW,而基于H100的机架消耗约40kW),大多数数据中心无法支持这一配置的广泛使用。然而,有一个主要客户计划大规模部署该产品,郭明錤指出,微软明显倾向于选择NVL72而非NVL36×2。

GB200 NVL36×2原计划由两个互联的机架组成,最初被认为是更常见的配置。每个机架有18个Grace CPU和36个Blackwell GPU,能够保持72个GPU之间的完全互联。然而,它需要36个NVSwitch ASIC,因此功耗比NVL72更高,性能略低。一个GB200 NVL36×2机架预计每个机架消耗66kW(总计132kW),尽管功耗稍高,但其较大的尺寸更适合现有的数据中心。

GB200 NVL72在空间利用率上远胜于GB200 NVL36×2。然而,大多数英伟达客户无法支持NVL72的功率和冷却密度需求。此外,复杂性可能导致GB200 NVL72的发货时间推迟至2025年下半年。郭明錤称,尽管早前的报道显示,部分NVL72机器将在今年12月交付,预计是交付给微软。

“我最新的供应链调查显示,NVL72的大规模生产可能会推迟到2025年下半年(相比英伟达乐观预测的2025年上半年),”郭明錤写道。

今年早些时候,英伟达在其B100和B200 GPU的封装中遇到了导致产量下降的问题,这促使公司生产低产量的Blackwell硬件以满足需求,并且改进了这些处理器的设计。改进后的GPU预计将在10月下旬开始大规模生产,因此将在明年1月底投入使用。在此背景下,专注于面向最苛刻客户的GB200 NVL72设计,对于追求最大性能的英伟达来说是完全合理的。

还需要注意的是,基于x86的搭载Blackwell处理器的服务器要到2025年才会推出。此阶段,这些机器的外形规格尚未确定,初步报告显示可能会采用NVL72和NVL36×2的配置。不过,现在看来,英伟达的重点已转向首先推出NVL72和NVL36机架,随后将由第三方定制解决方案推出。

参考链接

The above content is for informational or educational purposes only and does not constitute any investment advice related to Futu. Although we strive to ensure the truthfulness, accuracy, and originality of all such content, we cannot guarantee it.
    Write a comment