share_log

GPU霸主英伟达无可阻挡?这些公司可能是挑战者吗

Wallstreet News ·  Jun 1, 2023 22:53

来源:华尔街见闻

尽管仅在5月30日短暂突破万亿美元市值便再次下跌,但由ChatGPT引发的“英伟达”旋风,在AI业界却越刮越猛。

6月1日,多个独立信源告诉华尔街见闻,英伟达CEO黄仁勋将于6月5日至6月11日期间抵达中国大陆。但英伟达没有向华尔街见闻正面确认此则消息。

眼下,A股但凡和“英伟达”或“黄仁勋”三字沾边,个股都受到市场热捧。5月29日,黄仁勋在参加COMPUTEX 2023中国台北国际电脑展会时,演示英伟达新平台Isaac AMR(自主移动机器人)。这个平台的底盘采用了科创板公司的RMP系列产品,该公司盘中立即涨停。

在“超级AI应用”ChatGPT的指引下,英伟达第二季度营收预测值超出市场预期竟高达惊人的50%,至110亿美元。

谁还能阻挡英伟达称霸AI赛道?

英伟达的AI GPU强在何处?

英特尔已不再是当年那家占据统治地位的科技公司。

原本CPU是PC或服务器最重要的核心部件。但是现在,加速计算芯片通过杀手级应用ChatGPT正在加速取代CPU的地位。算力成为以IDC为基础条件的AI应用发展核心驱动力,GPU成为关键部件。

“生成式人工智能将是(英伟达业绩)引爆点。”黄仁勋说,“与CPU相比,未来IDC更需要GPU,因为数据都将通过生成式LLM自动生成,而非主要用于数据检索。”生成数据需要更多的GPU,而检索数据,只需要CPU。

目前,性能愈发强悍的PC系统配置了超过8个服务器GPU和1个CPU的算力硬件,英伟达占据了全球超过八成(84%)的服务器(IDC:数据中心)GPU市场份额。

比如,英伟达DGX系统,这是用于数据训练的IDC核心算力来源,搭载了8颗英伟达高端H100 GPU,还有两颗CPU;谷歌的A3超级计算机,同样用了8颗英伟达H100 GPU,但只用了1颗英特尔制造的高端至强处理器。

据英伟达公示的技术资料显示,H100于2022年三季度发布,训练速度比A100快9倍,推理速度比上代产品A100快30倍。5月29日,黄仁勋发布了GH200超级芯片,这是英伟达开发的基于Arm架构的CPU+GPU集成方案,用于开发聊天机器人、互联网推荐系统算法等大模型AI应用。

这个趋势随着AGI在产业的持续落地,产生的影响日益显著。英伟达IDC业务在第一季度增长了14%,但英特尔的AI和IDC业务部门业绩下降了39%。

另一项因素也在加强英伟达超越英特尔的优势。英伟达服务器GPU售价极高,单颗英伟达H100售价高达4万美元(eBay平台加急售价),而英特尔最新一代至强CPU的单颗标价虽然也很高,但“只有”1.7万美元。

当然英伟达也不是全无对手,当年英特尔的上游合作伙伴AMD,也在发力服务器GPU,包括高通、苹果、谷歌和亚马逊在内的众多巨头,都在设计开发移动AI算力芯片,而非服务器GPU;甚至是英特尔,在游戏领域的GPU技术实力,同样不容小觑。

但是在眼下,英伟达确实一家独大。但凡提及AGI算力,无不将英伟达服务器GPU列为首选。这主要是因为AGI目前对算力极为渴求,要处理处理TB级数据,训练性能要求极高,而在需要“推理”的过程中使用模型生成文本、图像或预测,也不是移动AI GPU能达成的。

更重要的还不在于英伟达的GPU硬件性能,而是——英伟达的AI软件系统:英伟达的AI专有软件,能轻松聚合GPU的硬件功能用于AI应用程序。

黄仁勋在英伟达财报电话会议上也说,“我们的软件不易复制,(竞对)必须设计所有的软件、库和算法,将它们集成到框架中并做持续优化;同时,软件架构也同样需要优化迭代。”

也就是说,要做到和英伟达一样,实现GPU与AI应用的无缝衔接,要做的不仅仅是优化芯片的设计和性能,还需要对软硬件的技术架构和整体框架做同步优化,这是一项系统工程。要超越单品性能虽然不易,但并非全无可能,但面对系统级能力,谈超越,难度不言而喻。

英伟达也在持续增加对IDC的资本投入。据英伟达最新财报显示,其整体收入中,IDC资本支出的份额占比已增至8.4%,而之前根据其上一年的固定比率预测为6.5%。

初创公司和巨头的现实威胁

看上去似乎无人能阻挡英伟达在AI技术领域的统治地位,但AI前景的无限空间,仍在吸引无数挑战者。

除了上文提及的多家巨头,初创AI公司成为英伟达AI挑战者大军不容忽视的一部分。当然,这种技术要求的初创公司很难出自无名之辈。

有一则极具戏剧性的传闻,出自在前沿技术和应用领域极为活跃的特斯拉公司首席执行官埃隆·马斯克(Elon Musk)之口。这位持续让世人惊叹的科技巨子说,“就连狗都在抢GPU”。

有鉴于此,所以马斯克虽然在口头上叫停研究AI技术,但他的身体却很诚实:这位老兄在今年3月9日建立了一家取名为“X.AI”的AI公司,还偷偷摸摸买了10000颗英伟达GPU。

想分英伟达一杯羹的还有来自英特尔公司架构、图形和软件(IAGS)部门的副总裁、首席架构师Raja Koduri,这位技术大拿已于今年3月底离职。接下来,Raja Koduri将创办一家AI技术公司,主要研发新一代生成式AI工具,目的是削弱英伟达对数字电影和视频游戏市场的控制力。

与马斯克的X.AI公司不知道要干嘛相比,Raja Koduri的计划更清晰。他这家尚未命名的AI初创公司,第一个项目,是要创建一套AI工具,以便让包括电影和游戏艺术家在内的消费群体,无论用PC、Mac、iPad还是其他设备,都无需深入研究软件代码而直接生成自己想要的工作结果。

尽管这些AI赛道新手看上去很想大干一场,但真正对英伟达有现实挑战能力的还是AMD、微软和谷歌此类巨头。其中,AMD在游戏领域的GPU对英伟达有些许威胁,但IDC需要的服务器专用GPU性能无法望其项背。

至于微软、谷歌甚至云服务商比如亚马逊,都一面和英伟达保持良好的业务合作,一面又在下大本钱研发自己的AI专用GPU。

比如微软,这个桌面PC时代的超级霸主,正是OpenAI的背后金主(2019年微软给OpenAI投了10亿美元),同时也是英伟达H100芯片最大的采购方。今年3月,微软用数万颗英伟达GPU帮OpenAI组装了一台AI超级计算机。

但微软也在推进自己的AI芯片研发计划,代号“雅典娜”。这项计划始于2019年,目标是为训练LLM(大语言模型)等软件而设计,同时可支持推理,能为ChatGPT背后的所有AI软件提供算力支持,初代雅典娜GPU量产时间表被定于2024年。

与微软相比,谷歌对英伟达的威胁可能更显著。目前谷歌的AI处理芯片是专为AI研究开发机器学习(Machine Learning)的专属芯片TPU(张量处理单元),能同时处理“云上”训练和推理,并设计了基准测试工具MLPerf。

谷歌TPU如今已迭代到V4版。据谷歌4月6日披露,得益于互连技术和领域特定加速器(DSA)方面的关键创新,谷歌云TPU v4在扩展机器学习系统性能方面比其前代版本有了近10倍的飞跃。

TPU v4是谷歌于2021年推出的、专门用于执行机器学习的AI芯片,是谷歌第5代特殊领域加速器(DSA:Domain Specific Accelerator)及第3代用于ML模型的超级计算机平台,其性能与英伟达A100相比,速度快1.2-1.7倍,功耗低1.3-1.9倍。

尽管如此,就眼下看,对英伟达具有商业层面现实威胁的公司,还不存在。这些威胁,现在还处于水面之下。

编辑/Jeffrey

The above content is for informational or educational purposes only and does not constitute any investment advice related to Futu. Although we strive to ensure the truthfulness, accuracy, and originality of all such content, we cannot guarantee it.
    Write a comment