華福證券：如何測算文本大模型AI訓練端算力需求？

智通財經 · 06/04 19:36

智通财经APP获悉，华福证券发布研究报告称，根据侧算力供给需求公式，需求侧假设行业依然沿Scaling Law发展方向进一步增长，供给侧通过对英伟达GPU的FP16算力、训练市场、算力利用率等进行假设，推导得出GPU需求量，以英伟达Hopper/Blackwell/下一代GPU卡FP16算力衡量，该行认为2024-2026年全球文本大模型AI训练侧GPU需求量为271/592/1244万张。建议关注算力芯片及服务器产业链。

华福证券主要观点如下：

需求侧：Scaling Law驱动大模型算力需求不减

Scaling Law仍然是当下驱动行业发展的重要标准。Scaling Law的基本原理是，模型的最终性能主要与计算量、模型参数量和数据大小三者相关，当不受其他两个因素制约时，模型性能与每个因素都呈现幂律关系。因此，为了提升模型性能，模型参数量和数据大小需要同步放大，从大模型数量上看，近年来呈现爆发式增长趋势，且由于尖端AI模型对于资源投入的大量需求，产业界对于大模型的影响力逐步加深，该行统计了产业界诸多公开披露的大模型训练数据，从大模型算力需求来看，GPT-3到GPT-4参数上从175B快速提升到1.8TB(提升9倍)，训练数据量(Token数)同方向快速增长，由0.3TB提升至13TB(提升42倍)。绝对值上看，根据该行的非完全统计情况，国内外主流大模型在参数量上基本已来到千亿量级，在预训练数据规模上均已来到个位数乃至十位数的TB量级。

供给侧：黄氏定律推动英伟达GPU一路高歌

英伟达GPU持续引领全球AI算力发展，虽然“摩尔定律”逐步放缓，但“黄氏定律”仍在支撑英伟达GPU算力快速提升，一方面，英伟达寻求制程工艺迭代、更大的HBM容量和带宽、双die设计等方法，另一方面，数据精度的降低起到关键作用，Blackwell首度支持FP4新格式，虽然低精度可能会存在应用上的局限性，但不失为一种算力提升策略。若仅考虑英伟达FP16算力，A100/H100/GB200产品的FP16算力分别为前代产品的2.5/6.3/2.5倍，在数量级上持续爆发，自2017年至今，GB200的FP16算力已达到V100的40倍。与之对比，AI大模型参数的爆发速度相对更快,以GPT为例,2018年至2023年，GPT系列模型从1亿参数规模大幅提升至18000亿,相较于AI大模型由Scaling Law驱动的参数爆发，GPU算力增速仍亟待提升，

结论：预计24-26年全球文本大模型训练卡需求为271/592/1244万张

该行根据侧算力供给需求公式，需求侧假设行业依然沿Scaling Law发展方向进一步增长，供给侧通过对英伟达GPU的FP16算力、训练市场、算力利用率等进行假设，推导得出GPU需求量，以英伟达Hopper/Blackwell/下一代GPU卡FP16算力衡量，该行认为2024-2026年全球文本大模型AI训练侧GPU需求量为271/592/1244万张。

建议关注：

算力芯片：寒武纪(688256.SH)、海光信息(688041.SH)、龙芯中科(688047.SH)。

服务器产业链：工业富联(601138.SH)、沪电股份(002463.SZ)、深南电路(002916.SZ)、胜宏科技(300476.SZ)。

风险提示：AI需求不及预期风险、Scaling Law失效风险、GPU技术升级不及预期的风险、测算模型假设存在偏差风险。

智通財經APP獲悉，華福證券發佈研究報告稱，根據側算力供給需求公式，需求側假設行業依然沿Scaling Law發展方向進一步增長，供給側通過對英偉達GPU的FP16算力、訓練市場、算力利用率等進行假設，推導得出GPU需求量，以英偉達Hopper/Blackwell/下一代GPU卡FP16算力衡量，該行認爲2024-2026年全球文本大模型AI訓練側GPU需求量爲271/592/1244萬張。建議關注算力芯片及服務器產業鏈。

華福證券主要觀點如下：

需求側：Scaling Law驅動大模型算力需求不減

Scaling Law仍然是當下驅動行業發展的重要標準。Scaling Law的基本原理是，模型的最終性能主要與計算量、模型參數量和數據大小三者相關，當不受其他兩個因素制約時，模型性能與每個因素都呈現冪律關係。因此，爲了提升模型性能，模型參數量和數據大小需要同步放大，從大模型數量上看，近年來呈現爆發式增長趨勢，且由於尖端AI模型對於資源投入的大量需求，產業界對於大模型的影響力逐步加深，該行統計了產業界諸多公開披露的大模型訓練數據，從大模型算力需求來看，GPT-3到GPT-4參數上從175B快速提升到1.8TB(提升9倍)，訓練數據量(Token數)同方向快速增長，由0.3TB提升至13TB(提升42倍)。絕對值上看，根據該行的非完全統計情況，國內外主流大模型在參數量上基本已來到千億量級，在預訓練數據規模上均已來到個位數乃至十位數的TB量級。

供給側：黃氏定律推動英偉達GPU一路高歌

英偉達GPU持續引領全球AI算力發展，雖然“摩爾定律”逐步放緩，但“黃氏定律”仍在支撐英偉達GPU算力快速提升，一方面，英偉達尋求製程工藝迭代、更大的HBM容量和帶寬、雙die設計等方法，另一方面，數據精度的降低起到關鍵作用，Blackwell首度支持FP4新格式，雖然低精度可能會存在應用上的侷限性，但不失爲一種算力提升策略。若僅考慮英偉達FP16算力，A100/H100/GB200產品的FP16算力分別爲前代產品的2.5/6.3/2.5倍，在數量級上持續爆發，自2017年至今，GB200的FP16算力已達到V100的40倍。與之對比，AI大模型參數的爆發速度相對更快,以GPT爲例,2018年至2023年，GPT系列模型從1億參數規模大幅提升至18000億,相較於AI大模型由Scaling Law驅動的參數爆發，GPU算力增速仍亟待提升，

結論：預計24-26年全球文本大模型訓練卡需求爲271/592/1244萬張

該行根據側算力供給需求公式，需求側假設行業依然沿Scaling Law發展方向進一步增長，供給側通過對英偉達GPU的FP16算力、訓練市場、算力利用率等進行假設，推導得出GPU需求量，以英偉達Hopper/Blackwell/下一代GPU卡FP16算力衡量，該行認爲2024-2026年全球文本大模型AI訓練側GPU需求量爲271/592/1244萬張。

建議關注：

算力芯片：寒武紀(688256.SH)、海光信息(688041.SH)、龍芯中科(688047.SH)。

服務器產業鏈：工業富聯(601138.SH)、滬電股份(002463.SZ)、深南電路(002916.SZ)、勝宏科技(300476.SZ)。

風險提示：AI需求不及預期風險、Scaling Law失效風險、GPU技術升級不及預期的風險、測算模型假設存在偏差風險。

譯文內容由第三人軟體翻譯。

以上內容僅用作資訊或教育之目的，不構成與富途相關的任何投資建議。富途竭力但無法保證上述全部內容的真實性、準確性和原創性。

华福证券：如何测算文本大模型AI训练端算力需求？

華福證券：如何測算文本大模型AI訓練端算力需求？

風險及免責聲明

聲明