share_log

英伟达王朝的“软肋”:GPU的三大风险

wallstreetcn ·  Jun 20 16:26

6月18日全球GPU龙头英伟达成为全球市值最大的公司

2024年6月18日美股收盘,英伟达市值达到3.33万亿美元,超过微软、苹果、谷歌、亚马逊成为全球市值最大的公司。

人工智能对GPU算力需求,是GPU的最大推动力

以英伟达为例,足见算力对GPU的拉动力。2024年Q1收入占比高达86.6%的数据中心业务,收入增长426%达到225亿美元。而在2016年英伟达的数据中心业务收入占比仅有6.77%。

拐点一:AI竞赛放缓,大模型创业公司倒闭退出

5月6日幻方的深度求索率先发起价格战,后续阿里、百度、腾讯、字节等旗下大模型跟进。目前大模型的主流应用还停留在问答模式,降价的背景是盈利模式无法很好落地,只能通过tokens收费。大模型创业公司若不改变无法盈利或看不到盈利预期的烧钱模式,未来就会有现金流中断的风险,大批量创业公司退出将会减少对GPU需求。

拐点二:三星投资GPU,新竞争者加入拉低行业利润率

行业龙头英伟达24Q1毛利率高达78.35%,净利润率57%,高利润率容易吸引更多的竞争者加入。三星公开宣布投资GPU,预示着与GPU行业巨头英伟达正面竞争。与谷歌等互联网大厂以fabless模式做GPU不同,三星做GPU有经验与技术积累:1.三星的半导体业务是IDM模式,设计与工艺紧密融合。2.三星拥有Exynos等处理器的成功经验,为GPU提供算力芯片设计参考。3.三星具有与GPU配套的高带宽内存芯片(HBM),可以从系统层面提升芯片算力组的能力。

拐点三:算法层的突变,从矩阵计算到无矩阵计算

通过算法的改进,减少对GPU的消耗,是技术层面的重大风险。前面两大风险都是中短期对GPU公司业绩的影响,是在原有的技术框架下的竞争。而算法技术层面的突变是较大的变革,如同从燃油车到电动车,对汽油的需求直接清零。矩阵乘法(MatMul)是Transformer大语言模型(LLM)中最耗费计算资源的运算,矩阵乘法占用了高昂的计算成本和庞大的内存需求。2024年6月18日arXiv的论文《ScalableMatMul-freeLanguageModeling》(第五版)中的新Transformer架构通过无矩阵乘法(MatMul-free),显著减少对GPU和内存依赖,并且使用FPGA方案替代GPU进行训练和推理,以13瓦特的功耗处理数十亿参数模型,已接近人脑效率。

投资建议:目前看以上三大拐点已有星星之火,若该星星之火在以后持续发展,对GPU行业或有实质性的影响。特别是第三个拐点,将会从底层改变GPU的投资逻辑。推荐关注算力产业链其他公司:国产CPU龙芯中科、先进制造中芯国际。

本文作者:何立中(SAC执证编号:S0110522110002),来源:首创证券,原文标题:《GPU的拐点》

The above content is for informational or educational purposes only and does not constitute any investment advice related to Futu. Although we strive to ensure the truthfulness, accuracy, and originality of all such content, we cannot guarantee it.
    Write a comment