追蹤AI最新趨勢

專題 865條資訊 15929人訂閱

深度好文 | 存儲，戰火重燃

遠川科技評論 · 02/24 11:54

來源：遠川科技評論

作者：何律衡

過去一年，全世界的科技公司都在搶購AI芯片，至今供不應求。

英偉達的產能上不來，很大程度上是因爲HBM（高帶寬內存）不夠用了。每一塊H100芯片，都會用到6顆HBM。當下，SK海力士、三星供應了90%的HBM，並且技術領先美光整整一個代際。

這給了韓國人一個史無前例的機會。

衆所周知，內存市場一直保持着三足鼎立的格局。其中，韓國人一家獨大：三星與SK海力士兩家公司，就佔去七成市場。但排名第三的美光，仍保有20%以上的市佔。雙方打得你來我往，各有勝負。

這樣的局面，韓國人大抵是不滿意的。上世紀80年代，日本曾攻下了9成以上的存儲器市場；這種壓倒性壟斷，才是韓國半導體的終極夢想。

因此在2024年初，韓國政府將HBM定爲國家戰略技術，併爲HBM供應商提供稅收優惠，準備再一次發起衝鋒。

如今，距離韓國人的夢想照進現實，似乎只有一步之遙了。

馮·諾依曼的“陷阱”

韓國人之所以能等來又一次機會，很大程度上得感謝“計算機之父”馮·諾依曼。

1945年，全球第一臺計算機ENIAC問世在即，馮·諾依曼聯合同事發表論文，闡述了一種全新的計算機體系架構。其中最大的突破在於“存算分離”——這是邏輯運算單元第一次從存儲單元中被剝離出來。

如果把計算機內部想象成後廚，那麼存儲器就是倉庫管理員，而邏輯芯片就是主廚。

最初，“炒菜”和“管倉庫”的工作，其實都是由同一塊芯片來完成的；隨着“存算分離”的概念被提出之後，計算機才開始設立多個“崗位”，並分別“招募人才”。

拆分出來的邏輯芯片，最終演變成了如今的CPU與GPU。

這麼做的好處顯而易見：存儲和邏輯芯片各司其職，如流水線一般絲滑，高效且靈活，很快獲得了初代計算機設計者的青睞，並一路延續至今，經久不衰。

這就是如今大名鼎鼎的馮·諾依曼架構。

然而，“計算機之父”馮·諾依曼在設計這套架構時，無意間埋下了一顆“炸彈”。

馮·諾依曼架構如果想要效率最大化，實際有一個隱含的前提：

即存儲器到邏輯芯片的數據傳輸速度，必須大於或等於，邏輯芯片的運算速度。翻譯成人話就是，倉庫管理員將食材送到後廚的速度，必須比主廚烹飪的速度快。

然而，現實中的科技樹，卻走上了一條截然相反的道路。

存儲器明顯跟不上邏輯芯片的迭代速度。以CPU爲例，早在上世紀80年代，這種性能失衡已無法忽視。到21世紀前，CPU和存儲器之間的性能差距已經在以每年50%的速率持續增長。

這就導致，決定一塊芯片算力上限的，不是邏輯芯片的算力，而是內存的傳輸速度。廚師已經嚴重溢出，倉管能送多少食材，決定了後廚能出多少菜。

這就是現在常說的“內存牆”，即馮·諾依曼所留下的陷阱。

上個世紀，有人曾試着嘗試改變現狀，一批全新的芯片架構展露了頭角。然而，蚍蜉難以撼樹，相較於圍繞馮·諾依曼架構建立的生態帝國——包括編程語言、開發工具、操作系統等帶來的好處，那一點性能提升，不值一提。

直到人工智能浪潮洶湧而至。

新的火種

以深度學習爲基石的人工智能，對算力有着近乎病態的需求。

OpenAI就曾做過一筆測算：從2012年的AlexNet模型到2017年穀歌的AlphaGoZero，算力消耗足足翻了30萬倍。隨着Transformer問世，“大力出奇跡”已然成爲人工智能行業的底層邏輯，幾乎所有科技公司都困於算力不足。

作爲阻撓算力進步的“罪魁禍首”，馮·諾依曼架構很快被推上了風口浪尖。

AMD是最先意識到問題嚴重性的科技巨頭之一。對此，它採用了一種非常“簡單粗暴”的解決方案——把存儲器放到離邏輯芯片更近的地方。我把“倉庫”建得離“後廚”近一點，送貨速度不就提上來了麼？

但在當年，AMD這套方案存在一個致命缺陷。

過去，存儲通常都通過插槽“外掛”在GPU封裝之外，相當於把倉庫建在郊區。

然而，AMD爲了縮短兩者的距離，打算將存儲器移到和GPU同一封裝內的同一塊載板上。但載板面積十分有限，如同寸土寸金的中心城區。傳統的內存往往面積又很大，彷彿一個特大型倉庫，中心城區顯然建不下。

至此，HBM開始登上歷史舞臺：它使用了縱向堆疊小型DRAM裸片的方式。

我們可以把HBM想象成一座高達12層的超小型倉庫。由於倉庫面積小，佔地需求大大降低，可以順理成章地搬進中心城區；與此同時，從1樓到12樓，每一層都能存儲數據，所以實際性能並沒有縮水。

當下，HBM的表面積，只有傳統內存的6%。這項新技術，讓AMD的技術方案得以成功落地。

於是，AMD向太平洋對岸的SK海力士伸出了橄欖枝。

2015年，AMD推出GPU Fiji，在一塊芯片載板上排布了4顆HBM，給了業內一個小小震撼。而搭載Fiji的高端顯卡Radeon R9 Fury X，當年在紙面算力上，也第一次超過了英偉達同代的Kepler系列。

雖然從後續市場表現來看，Fiji是一個失敗的作品，但沒有妨礙HBM的驚鴻一瞥，攪亂一池春水。

少數人的遊戲

當全球科技公司都開始押注人工智能，撞開了“內存牆”的HBM，也順勢走上時代舞臺的中心。

然而，只有少數人，能從HBM浪潮中分走蛋糕。當下，HBM即將跨入第四代，牌桌卻始終湊不齊四個人。截至2023年，有能力生產HBM的廠商仍然只有三家：SK海力士、三星、美光。遺憾的是，這個局面大概率還將保持很久。

三巨頭雖然也壟斷了傳統內存，但在市場景氣時，二、三線廠商也能跟着喝上肉湯。可在HBM領域，其餘廠商別說喝湯，連桌都上不了。

過高的技術門檻，是造成這種局面的重要原因。

前文曾提到，HBM是一座高樓層的小型倉庫；如何實現高樓層的設計，這背後可大有學問。

目前業內採用的技術叫TSV（硅通孔），是當前唯一的垂直電互聯技術。通過蝕刻和電鍍，TSV貫穿堆疊的DRAM裸片，實現各層的通信互聯，可以想象成給大樓安裝電梯。

由於HBM的面積實在太小了，導致對TSV工藝的精度有着極其嚴苛的要求。其操作難度，不亞於用電鑽給米粒鑽孔。而且，HBM還不止需要“鑽一個孔”：隨着大樓越造越高，HBM對TSV的需求量也會相應增加。

三巨頭在TSV技術上的積累最爲深厚，足以輕易甩開云云小廠，穩坐山頭。

原因之二，是HBM打破了傳統內存IDM的模式，需要依靠外援，自己說了不算。

IDM模式是指，從設計、製造到封裝全部由內存廠商一手包辦。過去，三星等內存廠商之所以敢發動價格戰，正是因爲掌握了整個製造流程，可以最大程度擠壓利潤空間。

但到了HBM，設計、製造還是自己做，可封裝這一環節，就必須依賴晶圓代工廠。

HBM畢竟不是一塊獨立的內存，需要安裝到邏輯芯片旁邊。這個過程涉及到更精細的操作、更精密的設備，以及更昂貴的材料，只能求助於先進封裝技術。當下，只有台積電的先進封裝技術達標，三巨頭都是它的客戶。

只是台積電的產能相當有限，僧多粥少，三巨頭都不夠用；新玩家想入局，還得看臺積電樂不樂意帶上你。

極高的技術門檻，以及對臺積電先進封裝產能的依賴，HBM大概率只能是少數人的遊戲。也正是因爲這些特點，讓HBM戰爭的打法，註定與過去的內存戰爭迥然不同。

重塑遊戲規則

衆所周知，傳統內存的競爭往往圍繞價格戰展開。因爲傳統內存是個高度標準化的產品，各家之間性能差距並不大。往往誰的價格更低，誰就能拿到更多訂單。

但對HBM來說，技術迭代更快的一方才握有主動權。

因爲HBM主要用於AI芯片，其主要賣點就是性能。一塊強大的AI芯片，能大幅縮短訓練模型的時間。對科技公司而言，只要能儘早將大模型推向市場，多花些“刀樂兒”又何妨？

因此在過去幾年，內存廠商一直在圍繞技術內卷。

2016年，三星能在HBM市場反超SK海力士，正是因爲率先量產了新一代的HBM 2，在技術上跑在了前頭。

另一方面，抱上一個夠粗的大腿，同樣也很重要。

因爲有能力生產AI芯片的科技公司，全世界數來數去就那麼幾家，對大客戶的依賴度很高。過去幾年，SK海力士、三星、美光圍繞HBM的比拼，實際比的就是誰抱的大腿更粗。

SK海力士下場最早，一出道就綁定了頗有野心的AMD。可惜AMD的芯片銷量不佳，連累SK海力士的HBM一度叫好不叫座。

相比之下，三星就相當“雞賊”，憑藉着率先量產的HBM2，成功抱上了英偉達的大腿，反超了SK海力士。

然而在2021年，SK海力士率先量產了HBM 3，成功將英偉達拉攏到自己的陣營中。如今全球瘋搶的AI芯片H100，用的就是SK海力士的HBM。新大腿加持下，SK海力士徹底奠定了“HBM一哥”的地位。

與韓國人相比，美光運氣最差，攤上了英特爾。

2016年，美光和英特爾押注了另一條技術路線。矇頭研發了數年，美光才意識到選錯了路線。此時，美光已經落後韓國對手整整兩個代際。

目前，SK海力士包攬了HBM整體供應的50%，隔壁的三星拿下了40%，美光僅有10%。

受到HBM業務的拉動，去年三季度SK海力士在內存市場的份額暴漲至34.3%，距離超越三星僅有一步之遙。要知道，三星已經在內存市場Top 1的位置坐了30多年了。

然而，拼迭代速度、拼大腿，新的打法，意味着更大的變數。三大廠商，目前看似分出了一二三名，實則各有底牌，正緩緩露出冰山一角。

三巨頭的底牌

作爲HBM的發明人、如今的第一名，SK海力士最大的底牌，顯然是遙遙領先的技術力。

爲了徹底殺死比賽，SK海力士準備直接顛覆HBM的設計思路。它計劃於2026年量產HBM 4，準備把HBM直接安在GPU頂部，走向真正的3D架構。也就是說，SK海力士準備直接將倉庫建在後廚樓上。

乍一看，HBM 4的設計思路似乎並不驚豔。

畢竟HBM的設計初衷，就是爲了縮短倉庫與後廚的距離；那麼幹脆把倉庫搬到後廚樓上，似乎是個很自然的選擇。然而，現實情況卻沒那麼簡單。

此前，各大內存廠商之所以沒采用這一設計，是因爲遲遲解決不了散熱：

把HBM裝到GPU頂部之後，數據傳輸的速度確實是更快了，但芯片功耗也會大幅上升，產生更多的熱能。如果不能及時散熱，將大大降低芯片工作效率，造成性能損耗，頗有種拆東牆補西牆的意味。

因此，如果想實現HBM 4的設計，必須得找到更好的散熱方案。

目前來看，SK海力士或許找到了突破口；一旦成功落地，無疑是對友商的降維打擊。

當然，SK海力士的模式也有缺陷——過於依賴台積電了。

前文曾提到，HBM技術高度綁定台積電的先進封裝。但在當下，台積電的產能遠遠跟不上市場的需求，這就給三星留出了二度彎道超車的空間。

三星不僅是存儲器市場的最大卷王，同時也是全球第二大晶圓代工廠。台積電有的，三星基本都有，包括先進封裝，只是水平稍微差了些。

早在2018年，三星就推出了對標台積電的I-Cube技術，2021年時已經發展到第四代。

目前來看，三星的I-Cube技術顯然是不及台積電的CoWoS，畢竟連三星自己都不用。但在臺積電產能明顯供不應求的當下，I-Cube技術就成了三星拉攏生意的武器。

SK海力士的老搭檔AMD，就沒能抵抗住“產能的誘惑”，更改了陣營。英偉達據說也有意試水，畢竟台積電的先進封裝增產有限，啓用三星有助於分散供應風險。

韓國人各有各的張良計，美國人有什麼過橋梯？

說實話，到目前爲止，美光在HBM的戰場上，一直處於被動挨打、從未翻身的局面。經過近幾年的追趕，美光總算望見了先頭部隊的背影，但也僅僅只能跟在韓國人身後“撿漏”。

距離韓國人“一統內存江山”的終極理想，似乎只差最後一步了。

不過，這顯然是美國人所不樂於見到的。目前，HBM的大客戶們，大多來自美國。美光雖然落後，卻未必會完全出局。最新爆料顯示，英偉達剛向美光預訂了一批HBM 3。

此前，韓國人之所以能在內存市場“百戰百勝”，是因爲競爭的規則極其明確：即拼產能、成本。內卷向來是韓國人的“舒適區”，畢竟他們血管裏流的都是美式咖啡。

然而，HBM是一個不那麼“東亞”的產業。它面臨着極其嚴苛的技術競爭，以及隨時搖擺的大客戶。更多的變數，讓韓國人始終無法穩穩佔據鐵王座。更何況，另一股東方的神祕力量，也在虎視眈眈。

長夜漫漫，韓國人仍然無法安睡。

編輯/phoebe

譯文內容由第三人軟體翻譯。

以上內容僅用作資訊或教育之目的，不構成與富途相關的任何投資建議。富途竭力但無法保證上述全部內容的真實性、準確性和原創性。

追蹤AI最新趨勢

深度好文 | 存储，战火重燃

深度好文 | 存儲，戰火重燃

冯·诺依曼的“陷阱”

新的火种

少数人的游戏

重塑游戏规则

三巨头的底牌

馮·諾依曼的“陷阱”

新的火種

少數人的遊戲

重塑遊戲規則

三巨頭的底牌

追蹤AI最新趨勢

深度好文 | 存储，战火重燃

深度好文 | 存儲，戰火重燃

冯·诺依曼的“陷阱”

新的火种

少数人的游戏

重塑游戏规则

三巨头的底牌

馮·諾依曼的“陷阱”

新的火種

少數人的遊戲

重塑遊戲規則

三巨頭的底牌

風險及免責聲明

聲明