share_log

GPU又赢了?苹果临阵倒戈!

半导体行业观察 ·  Mar 28 01:07

(原标题:GPU又赢了?苹果临阵倒戈!)

如果您希望可以时常见面,欢迎标星收藏哦~

GPU再胜一局!2025年3月,Loop Capital爆出一则重磅消息:Apple已向NVIDIA订购总额约10亿美元的GB300 NVL72 GPU集群服务器系统,由Super Micro Computer(SMCI)与Dell联合交付。在AI领域“掉队”的苹果,终于正式进入“大型服务器集群 Gen AI 游戏”。无论是科技巨头(如苹果、谷歌、Meta)还是初创公司,都在依赖NVIDIA的GPU来加速其AI战略。AI 领域的垄断巨头正享受着属于他们的高光时刻。

苹果终转向商用GPU?

苹果长期以来以自研芯片为核心竞争力,其Apple Silicon系列通过深度软硬件协同,在移动设备和边缘计算领域取得了巨大成功。此前,苹果软件工程高级副总裁Craig Federighi曾公开确认,Apple Intelligence服务完全运行在自研的Apple Silicon服务器上,并称之为“行业云端处理新标准”。

然而,这次转向NVIDIA的商用GPU,在AI策略上的转变,也反映了苹果承认了GPU生态和Gen AI范式的优势,并愿意为此砸下重金。可能是在生成式AI(Gen AI)领域,自研芯片的开发周期和优化成本难以满足当前市场对高性能计算的迫切需求。据分析师Ananda Baruah的报告透露,苹果正计划订购约250台英伟达的NVL72服务器,每台服务器的成本预计在370万至400万美元之间,总价近10亿美元。

Siri“失利”是导火索,业界对苹果AI一直以来都翘首以盼。然而,Siri近年来在与竞争对手(如Google Assistant和Alexa)的对比中逐渐失去竞争力,原本预计今年春季 iOS 18.4 会更新Siri,但是,苹果已将Siri Apple Intelligence功能推迟到明年,苹果在今年3月初罕见地承认了这一点,并委婉地表示:“我们还在努力打造更加个性化的 Siri,让它更了解你的个人情况,并能够在你的应用内和跨应用为你采取行动。实现这些功能需要比我们预想的更长的时间,我们预计将在明年推出它们。”

生成式AI爆火了两三年,OpenAI、Anthropic、Google等玩家在Gen AI赛道上狂奔,GPT-4、Claude、Gemini已经实现推理、多轮对话、文档操作、编程协助等核心能力。AI PC也已经逐渐落地了。大模型重新定义了用户对“智能助理”的期望,用户的心理预期已从“命令执行”跃迁至“智能协同”。而作为全球最大的手机厂商——苹果显然是有点“掉队了”。这也促使苹果重新评估其AI硬件策略,从传统的AI/ML(机器学习)转向更前沿的Gen AI技术。

Apple此次投下这10亿美元大单,它想干什么?有几个推测:一是打造Apple LLM,嵌入Siri新版本,实现设备级混合部署(本地+云);二、构建Apple AI Cloud,支持iOS/macOS等设备远程AI增强;三、未来将AI深度集成到iWork套件、Health、Shortcuts等应用中。

尽管此次采购NVIDIA GPU,苹果不太可能完全放弃自研芯片。一种可能的路径是:利用NVIDIA GPU进行模型训练和开发,而Apple Silicon则专注于推理(inference)和边缘设备。这种混合策略能够平衡性能与成本,同时保留苹果在生态系统中的控制力。

GPU的胜利

尽管苹果在自研ASIC领域拥有深厚积累,但最终选择投向NVIDIA阵营,透露出两大关键信号:首先,时间优先级成为压倒性因素——苹果显然不愿等待自研Gen AI专用ASIC的漫长开发周期;其次,GPU在短期内的性能优势和生态成熟度,盖过了定制化带来的效率红利。特别是NVIDIA的GPU搭配CUDA生态,已成为训练大语言模型(LLM)的事实标准。这种“时间与性能”的取舍,清晰地驱动了苹果的决策。

生成式AI(如LLM)的崛起,对算力架构提出了全新要求:超高的并行吞吐量、海量的内存带宽以及灵活的计算结构。这些需求让通用GPU的优势进一步凸显,而非通用架构(如传统ASIC)在短期内难以匹敌NVIDIA在性能与生态上的领先地位。

过去两年,NVIDIA GPU的价格已飙升至每颗9万美元,其财务表现也印证了这一统治力:在截至1月26日的第四季度,NVIDIA实现营收393亿美元,同比增长78%。英伟达的毛利率高达70%以上,远超竞争对手AMD的50%。这种高毛利不仅反映了市场对其产品的旺盛需求,也凸显了其在AI硬件领域的定价权。

理论上,高昂的芯片成本可能推高AI服务(如ChatGPT或Microsoft Copilot)的价格,最终转嫁给消费者。然而,目前硅谷科技巨头似乎更愿意自行消化这些成本,以抢占AI竞赛的先机。NVIDIA约41%的收入来自微软、谷歌、亚马逊和Meta四大客户,这些公司均表示,GPU供应不足已成为构建AI数据中心的瓶颈。

今年 1 月,英伟达的前景遭遇了一次震荡——中国初创公司 DeepSeek 发布了一个具有竞争力的 AI 模型,声称其背后预算极为有限。英伟达的市值在一天之内几乎蒸发了 6000 亿美元。不过,英伟达在接下来的几周内大部分恢复了这些损失。行业的普遍假设是,DeepSeek 模型所暗示的这种更廉价的 AI,将只会增加全球对 AI 服务和其背后硬件的需求。科技巨头们并没有改变自己对AI基础设施的建设,反而愈演愈烈:Meta计划今年斥资650亿美元建设AI基础设施,包括一个规模堪比“曼哈顿大部分地区”的数据中心;微软、谷歌等全球九大科技公司预计2025年在AI上的总支出将达3710亿美元,同比增长44%。

有AI专家则认为,DeepSeek的成就实际上只会巩固英伟达的地位,因为这仍然发生在英伟达的软硬件生态系统中。与此同时,普遍认为 DeepSeek 是借助现有模型(如 OpenAI 的 GPT)进行开发的,而这些模型的构建依赖于巨大的计算资源。

在硬件层面,NVIDIA最新推出的GB300 NVL72平台堪称巅峰之作。这款机架级设计集成了72个Blackwell Ultra GPU和36个基于Arm Neoverse的Grace CPU,形同一个为推理和训练优化的巨型GPU。与前代Hopper架构相比,GB300 NVL72在响应速度(TPS,每用户每秒事务数)上提升10倍,能效吞吐率(每兆瓦TPS)提升5倍,整体AI产出能力跃升50倍。这种性能飞跃让自研ASIC或传统x86 CPU在面对大规模并行计算时,几乎无法与之抗衡。

来源:NVIDIA

NVIDIA创始人黄仁勋曾表示:“Blackwell的需求令人震惊。AI推理引入了新的缩放定律——更多训练算力让模型更智能,更多推理算力让答案更精准。”这一洞察不仅揭示了AI算力的双轮驱动逻辑,也预示了NVIDIA的增长势头。展望2026财年第一季度,公司预计营收将达430亿美元,显示其在AI硬件市场的统治力仍在延续。

从苹果的妥协,到科技巨头的狂热投入,再到DeepSeek的意外挑战,GPU的胜利不仅是技术路线的胜出,更是对时间与性能极致追求的见证。在AI驱动的未来,GPU的通用算力生态正成为不可撼动的基石。

ASIC的“失败”

与GPU的耀眼成就相比,ASIC(专用集成电路)在生成式AI(Gen AI)浪潮中的暂时“失利”,为自研芯片路线敲响了警钟——在技术竞争中,“错过时间窗口”比性能稍逊更为致命。

在半导体领域,自研ASIC(如Apple Silicon)与商用GPU之间的技术路线之争由来已久,核心在于“定制化”与“通用性”的博弈。从技术特性来看,自研ASIC在特定任务(如AI推理阶段)上具备更高的效率,但其设计和验证周期漫长,难以跟上人工智能领域日新月异的发展节奏。相比之下,通用GPU凭借灵活性和强大的生态支持,在快速迭代的AI市场中占据了上风。

ASIC的开发周期是其最大软肋。以苹果为例,作为全球芯片设计的佼佼者,其从架构设计到流片验证仍需数年时间。然而,Gen AI的竞争是一场速度至上的赛跑,大语言模型(LLM)等技术的迭代周期以月计,市场需求瞬息万变。苹果显然无法承受自研AI专用ASIC逐步成熟的等待期。相比之下,NVIDIA的GPU作为成熟的商用解决方案,可立即投入使用,直接满足苹果对算力的迫切需求。这种时间上的差距,成为ASIC在短期内失利的关键。

ASIC的另一大短板在于灵活性不足。作为专为特定任务优化的“专用芯片”,ASIC在固定场景下(如推理或网络加速)表现出色,但在Gen AI的工作负载面前却显得捉襟见肘。LLM的训练涉及多样化的算法和不断扩展的模型规模,需要硬件具备高度的通用性和适应性。而ASIC的设计初衷恰恰与之相悖,其定制化特性难以快速响应AI领域的动态需求。反观NVIDIA GPU,凭借通用架构和CUDA生态的加持,不仅能覆盖训练与推理的全流程,还能灵活适应新算法的演进。这种灵活性让ASIC在竞争中相形见绌。

博通和Marvell作为ASIC设计服务的两大厂商,也面临不利局面。

去年底,The Information报道称,苹果正与博通合作开发代号为“Baltra”的AI服务器芯片。这款芯片聚焦网络技术,预计2026年量产,仅限苹果内部使用,并采用台积电N3P工艺(与OpenAI和NVIDIA的AI芯片工艺一致)。尽管博通在传统数据中心市场凭借网络加速器等定制ASIC表现强劲,但其产品在AI训练领域的竞争力仍无法与GPU抗衡。

Marvell则通过ThunderX系列Arm CPU和定制芯片布局AI市场,但其方案更偏向推理而非训练,难以满足苹果在大规模LLM训练上的需求。

苹果此前透露,它也在探索使用亚马逊的Trainium2芯片进行 AI 模型预训练。如今选择英伟达GPU,还是佐证了通用GPU尤其是英伟达GPU短期地位难以撼动。

当然,这并不意味着ASIC彻底退出舞台。苹果未来可能采取“GPU训练+ASIC推理”的混合策略,利用NVIDIA完成模型开发,再用Apple Silicon优化边缘部署。然而,在当前阶段,ASIC的“失败”更多是时间窗口的失利,而非技术的终结。

总结

苹果10亿美元豪购NVIDIA GB300 NVL72的决定,既是其AI战略的急转弯,也是GPU在生成式AI时代统治力的又一注脚。在这场技术与时间的赛跑中,通用算力以其现成性和适应性,击败了定制化方案的长期潜力,即使如苹果这般自研能力傲视群雄的巨头,也不得不向现实低头。Siri的失利、Gen AI的狂飙,以及用户对“智能协同”的新期待,共同将苹果推向了英伟达的怀抱。然而,这并非ASIC的终曲,而是时间窗口与生态博弈的阶段性结果。未来,当苹果的自研芯片与GPU的混合策略成熟,AI算力的王座之争或许会迎来新的转折。但至少在当下,英伟达的GPU不仅是技术的胜利,更是时间铁律的化身——在AI的狂潮中,谁能更快站上风口,谁就握住了定义未来的钥匙。

半导体精品公众号推荐

专注半导体领域更多原创内容

关注全球半导体产业动向与趋势

*免责声明:本文由作者原创。文章内容系作者个人观点,半导体行业观察转载仅为了传达一种不同的观点,不代表半导体行业观察对该观点赞同或支持,如果有任何异议,欢迎联系半导体行业观察。

今天是《半导体行业观察》为您分享的第4077期内容,欢迎关注。

『半导体第一垂直媒体』

实时 专业 原创 深度

公众号ID:icbank

喜欢我们的内容就点“在看”分享给小伙伴哦

The above content is for informational or educational purposes only and does not constitute any investment advice related to Futu. Although we strive to ensure the truthfulness, accuracy, and originality of all such content, we cannot guarantee it.
3
Comment Comment · Views 6935

Recommended

Write a comment

Statement

This page is machine-translated. Futubull tries to improve but does not guarantee the accuracy and reliability of the translation, and will not be liable for any loss or damage caused by any inaccuracy or omission of the translation.