聚焦科技股

專題 2344條資訊 31274人訂閱

早已忍受不了英偉達，六大巨頭紛紛自研AI芯片

Wind · 2023/10/07 12:34

来源：Wind

10月7日，知情人士透露，$微软 (MSFT.US)$计划在下个月的年度开发者大会上推出该公司首款为人工智能设计的芯片。微软的这款芯片是为训练和运行大型语言模型（LLM）的数据中心服务器设计的。

各大巨头早已经忍受不了英伟达

英伟达是当之无愧的“AI算力王者”，A100、H100系列芯片占据金字塔顶尖位置，是ChatGPT这样的大型语言模型背后的动力来源。

但用户面对英伟达的独霸天下，吃尽了成本高昂的苦头。

根据华尔街投行伯恩斯坦的分析，ChatGPT单次查询的成本约为4美分，如果ChatGPT的搜索量增长到谷歌搜索量的十分之一，每年将需要大约价值481亿美元的GPU以及价值约160亿美元的芯片来维持运行。

不管是为了降低成本，还是减少对英伟达的依赖、提高议价能力，科技巨头们也都纷纷下场自研AI芯片。

微软早就自研芯片

微软的数据中心服务器目前使用英伟达的GPU为云客户提供先进的LLM，包括OpenAI和$财捷 (INTU.US)$，以及支持微软生产力应用程序中的人工智能功能。

其实，之前早有消息，微软意欲用Athena替代昂贵的A100/H100。

4月18日，科技媒体The Information报道称，微软正在秘密研发自己的AI芯片，代号雅典娜（Athena）。该芯片由$台积电 (TSM.US)$代工，采用5nm先进制程，计划最早于明年推出。

报道称，微软自2019年以来就一直在开发一款定制的专用芯片，用于为大型语言模型提供动力，目前已在测试阶段。Athena的首个目标是为OpenAI提供算力引擎，以替代昂贵的英伟达A100/H100。如果明年大规模推出，Athena将允许微软内部和OpenAI的团队同时训练和推理模型。

SemiAnalysis的分析师迪伦·帕特尔（Dylan Patel）表示，开发类似于雅典娜的芯片可能每年需要花费1亿美元左右，ChatGPT每天的运营成本约70万美元，大部分成本来源于昂贵的服务器，如果雅典娜芯片与英伟达的产品拥有同等竞争力，每个芯片的成本将可以降低三分之一。

OpenAI尝试收购

OpenAI也正在探索制造自研人工智能芯片，并已开始评估潜在的收购目标。

报道称，至少从去年开始，OpenAI就已讨论各种方案，以解决AI芯片短缺问题。OpenAI已将获取更多AI芯片列为公司首要任务，讨论方案包括自研AI芯片，与包括英伟达在内的其他芯片制造商更密切地合作，以及在英伟达之外实现供应商多元化。

特斯拉立足于智能驾驶

目前，$特斯拉 (TSLA.US)$已经推出了两种自研芯片：全自动驾驶（FSD）芯片和Dojo D1芯片。FSD芯片是用于特斯拉汽车上的自动驾驶系统的芯片，Dojo D1芯片则是用于特斯拉超级计算机Dojo的芯片，它是一种高吞吐量、通用的CPU，不是一种加速器。它的目的是为了加速特斯拉自动驾驶系统的训练和改进。

谷歌：最早自研TPU芯片

早在2013年，谷歌就已秘密研发一款专注于AI机器学习算法的芯片，并将其用在内部的云计算数据中心中，以取代英伟达的GPU。2016年5月，这款自研芯片公诸于世，即TPU。TPU可以为深度学习模型执行大规模矩阵运算，例如用于自然语言处理、计算机视觉和推荐系统的模型，其最初专为谷歌的超级业务云计算数据中心而生。

2020年，谷歌实际上已在其数据中心部署了人工智能芯片TPU v4。不过直到今年4月4日，谷歌才首次公开了技术细节：相比TPU v3，TPU v4性能提升2.1倍。

亚马逊：训练和推理芯片占据先机

从2013年推出首颗Nitro1芯片至今，AWS是最先涉足自研芯片的云厂商，已拥有网络芯片、服务器芯片、人工智能机器学习自研芯片3条产品线。

2018年初，科技媒体Information爆料$亚马逊 (AMZN.US)$已经开始设计定制AI芯片。

AWS自研AI芯片版图包括推理芯片Inferentia和训练芯片Trainium。2018年底，AWS推出自研AI推理芯片Inferentia，可以以低成本在云端运行图像识别、语音识别、自然语言处理、个性化和欺诈检测等大规模机器学习推理应用程序。

2020年底，AWS推出专用于训练机器学习模型的Trainium。

2023年初，专为人工智能打造的Inferentia 2发布，将计算性能提高了三倍，加速器总内存提高了四分之一，吞吐量提高了四分之一，延迟提高了十分之一。Inf2实例（可通过芯片之间的直接超高速连接支持分布式推理）最多可支持1750亿个参数，这使其成为大规模模型推理的有力竞争者。

在亚马逊、微软和谷歌这三家中，亚马逊是唯一一家在服务器中提供两种类型芯片（标准计算芯片和用于训练与运行机器学习模型的专用芯片）的云提供商，其在2015年收购以色列芯片设计公司Annapurna Labs为这些努力奠定了基础。

Meta：基于RISC-V开源架构

直到2022年，$Meta Platforms (META.US)$还主要使用CPU（中央处理器）和专为加速AI算法而设计的定制芯片组合来运行其AI工作负载。对于这类任务来说，CPU的效率往往不如GPU。

后来，Meta取消了于2022年大规模推出定制芯片的计划，转而订购了价值数十亿美元的英伟达GPU。

为了扭转局面，Meta已经在开发内部芯片，并于5月19日公布了AI训练与推理芯片项目，称其为“针对推理工作负载的内部定制加速器芯片系列”。

据介绍，MTIA芯片的功耗仅为25瓦，占英伟达等市场领先供应商芯片功耗的一小部分，并使用了RISC-V（第五代精简指令处理器）开源架构。

值得注意的是，Meta于5月初收购了英国AI芯片独角兽Graphcore的AI网络技术团队。Graphcore创始人奈杰尔·图恩（Nigel Toon）曾公开表示，Graphcore不属于CPU、GPU和ASIC（专用计算芯片）中的任何一类，而是一款全新的，专为AI加速而生的处理器：既有极高的运算能力以处理高性能计算业务（HPC），又和GPU一样可编程，以满足不同的场景需求。

编辑/Corrine

來源：Wind

10月7日，知情人士透露，$微軟 (MSFT.US)$計劃在下個月的年度開發者大會上推出該公司首款爲人工智能設計的芯片。微軟的這款芯片是爲訓練和運行大型語言模型（LLM）的數據中心服務器設計的。

各大巨頭早已經忍受不了英偉達

英偉達是當之無愧的“AI算力王者”，A100、H100系列芯片佔據金字塔頂尖位置，是ChatGPT這樣的大型語言模型背後的動力來源。

但用戶面對英偉達的獨霸天下，吃盡了成本高昂的苦頭。

根據華爾街投行伯恩斯坦的分析，ChatGPT單次查詢的成本約爲4美分，如果ChatGPT的搜索量增長到谷歌搜索量的十分之一，每年將需要大約價值481億美元的GPU以及價值約160億美元的芯片來維持運行。

不管是爲了降低成本，還是減少對英偉達的依賴、提高議價能力，科技巨頭們也都紛紛下場自研AI芯片。

微軟早就自研芯片

微軟的數據中心服務器目前使用英偉達的GPU爲雲客戶提供先進的LLM，包括OpenAI和$財捷 (INTU.US)$，以及支持微軟生產力應用程序中的人工智能功能。

其實，之前早有消息，微軟意欲用Athena替代昂貴的A100/H100。

4月18日，科技媒體The Information報道稱，微軟正在祕密研發自己的AI芯片，代號雅典娜（Athena）。該芯片由$台積電 (TSM.US)$代工，採用5nm先進製程，計劃最早於明年推出。

報道稱，微軟自2019年以來就一直在開發一款定製的專用芯片，用於爲大型語言模型提供動力，目前已在測試階段。Athena的首個目標是爲OpenAI提供算力引擎，以替代昂貴的英偉達A100/H100。如果明年大規模推出，Athena將允許微軟內部和OpenAI的團隊同時訓練和推理模型。

SemiAnalysis的分析師迪倫·帕特爾（Dylan Patel）表示，開發類似於雅典娜的芯片可能每年需要花費1億美元左右，ChatGPT每天的運營成本約70萬美元，大部分成本來源於昂貴的服務器，如果雅典娜芯片與英偉達的產品擁有同等競爭力，每個芯片的成本將可以降低三分之一。

OpenAI嘗試收購

OpenAI也正在探索製造自研人工智能芯片，並已開始評估潛在的收購目標。

報道稱，至少從去年開始，OpenAI就已討論各種方案，以解決AI芯片短缺問題。OpenAI已將獲取更多AI芯片列爲公司首要任務，討論方案包括自研AI芯片，與包括英偉達在內的其他芯片製造商更密切地合作，以及在英偉達之外實現供應商多元化。

特斯拉立足於智能駕駛

目前，$特斯拉 (TSLA.US)$已經推出了兩種自研芯片：全自動駕駛（FSD）芯片和Dojo D1芯片。FSD芯片是用於特斯拉汽車上的自動駕駛系統的芯片，Dojo D1芯片則是用於特斯拉超級計算機Dojo的芯片，它是一種高吞吐量、通用的CPU，不是一種加速器。它的目的是爲了加速特斯拉自動駕駛系統的訓練和改進。

谷歌：最早自研TPU芯片

早在2013年，谷歌就已祕密研發一款專注於AI機器學習算法的芯片，並將其用在內部的雲計算數據中心中，以取代英偉達的GPU。2016年5月，這款自研芯片公諸於世，即TPU。TPU可以爲深度學習模型執行大規模矩陣運算，例如用於自然語言處理、計算機視覺和推薦系統的模型，其最初專爲谷歌的超級業務雲計算數據中心而生。

2020年，谷歌實際上已在其數據中心部署了人工智能芯片TPU v4。不過直到今年4月4日，谷歌才首次公開了技術細節：相比TPU v3，TPU v4性能提升2.1倍。

亞馬遜：訓練和推理芯片佔據先機

從2013年推出首顆Nitro1芯片至今，AWS是最先涉足自研芯片的雲廠商，已擁有網絡芯片、服務器芯片、人工智能機器學習自研芯片3條產品線。

2018年初，科技媒體Information爆料$亞馬遜 (AMZN.US)$已經開始設計定製AI芯片。

AWS自研AI芯片版圖包括推理芯片Inferentia和訓練芯片Trainium。2018年底，AWS推出自研AI推理芯片Inferentia，可以以低成本在雲端運行圖像識別、語音識別、自然語言處理、個性化和欺詐檢測等大規模機器學習推理應用程序。

2020年底，AWS推出專用於訓練機器學習模型的Trainium。

2023年初，專爲人工智能打造的Inferentia 2發佈，將計算性能提高了三倍，加速器總內存提高了四分之一，吞吐量提高了四分之一，延遲提高了十分之一。Inf2實例（可通過芯片之間的直接超高速連接支持分佈式推理）最多可支持1750億個參數，這使其成爲大規模模型推理的有力競爭者。

在亞馬遜、微軟和谷歌這三家中，亞馬遜是唯一一家在服務器中提供兩種類型芯片（標準計算芯片和用於訓練與運行機器學習模型的專用芯片）的雲提供商，其在2015年收購以色列芯片設計公司Annapurna Labs爲這些努力奠定了基礎。

Meta：基於RISC-V開源架構

直到2022年，$Meta Platforms (META.US)$還主要使用CPU（中央處理器）和專爲加速AI算法而設計的定製芯片組合來運行其AI工作負載。對於這類任務來說，CPU的效率往往不如GPU。

後來，Meta取消了於2022年大規模推出定製芯片的計劃，轉而訂購了價值數十億美元的英偉達GPU。

爲了扭轉局面，Meta已經在開發內部芯片，並於5月19日公佈了AI訓練與推理芯片項目，稱其爲“針對推理工作負載的內部定製加速器芯片系列”。

據介紹，MTIA芯片的功耗僅爲25瓦，佔英偉達等市場領先供應商芯片功耗的一小部分，並使用了RISC-V（第五代精簡指令處理器）開源架構。

值得注意的是，Meta於5月初收購了英國AI芯片獨角獸Graphcore的AI網絡技術團隊。Graphcore創始人奈傑爾·圖恩（Nigel Toon）曾公開表示，Graphcore不屬於CPU、GPU和ASIC（專用計算芯片）中的任何一類，而是一款全新的，專爲AI加速而生的處理器：既有極高的運算能力以處理高性能計算業務（HPC），又和GPU一樣可編程，以滿足不同的場景需求。

編輯/Corrine

譯文內容由第三人軟體翻譯。

以上內容僅用作資訊或教育之目的，不構成與富途相關的任何投資建議。富途竭力但無法保證上述全部內容的真實性、準確性和原創性。

聚焦科技股

早已忍受不了英伟达，六大巨头纷纷自研AI芯片

早已忍受不了英偉達，六大巨頭紛紛自研AI芯片

各大巨头早已经忍受不了英伟达

微软早就自研芯片

OpenAI尝试收购

特斯拉立足于智能驾驶

谷歌：最早自研TPU芯片

亚马逊：训练和推理芯片占据先机

Meta：基于RISC-V开源架构

各大巨頭早已經忍受不了英偉達

微軟早就自研芯片

OpenAI嘗試收購

特斯拉立足於智能駕駛

谷歌：最早自研TPU芯片

亞馬遜：訓練和推理芯片佔據先機

Meta：基於RISC-V開源架構

風險及免責聲明

聲明