來源: 半導體行業觀察
近年來,隨着AI競爭愈演愈烈,無論是傳統還是新興的處理器巨頭都在圍繞CPU、GPU和AI加速器展開了激烈競爭。尤其是AMD、Intel和英偉達三大標誌性巨頭,由於三者的競爭包含後來者的追趕逆襲、新市場的來勢洶洶、老巨頭的不甘人後等情節,使得這三個巨頭的任何動向尤爲關注。這三家公司圍繞着人工智能和PC展開明爭暗鬥也是衆所周知。
但近日,這三家公司罕見聯手,投資了一家名爲Ayar Labs的光芯片初創公司。
三大芯片巨頭,看上光互連
Ayar Labs今天宣佈,已獲得由 Advent Global Opportunities 和 Light Street Capital 領投的 1.55 億美元融資,旨在利用其光學 I/O 技術打破 AI 數據移動瓶頸。這使該公司的總融資額達到 3.7 億美元,並將公司估值提高至 10 億美元以上。
正如Ayar Labs所說,本輪融資的規模和投資者的素質標誌着 Ayar Labs 的又一個重要里程碑,該公司正在準備其光學解決方案,以戰略性地配合客戶路線圖進行大批量生產。該公司表示,參與本輪融資的知名公司就涵括了當前最炙手可熱的芯片三大巨頭 $美國超微公司 (AMD.US)$ 、 $英特爾 (INTC.US)$ 和$英偉達 (NVDA.US)$,其他新戰略和金融投資者包括 3M Ventures 和 Autopilot。值得一提的是,在之前,Ayar Labs也拿了包括Applied Ventures LLC、Axial Partners、Boardman Bay Capital Management、GlobalFoundries、IAG Capital Partners、Lockheed Martin Ventures、Playground Global 和 VentureTech Alliance在內的衆多知名企業和機構的錢。
Ayar Labs 首席執行官兼聯合創始人 Mark Wade 表示:「領先的 GPU 提供商 AMD 和 NVIDIA 以及半導體代工廠 GlobalFoundries、Intel Foundry 和 TSMC,再加上 Advent、Light Street 和我們其他投資者的支持,凸顯了我們的光學 I/O 技術重新定義 AI 基礎設施未來的潛力。」「我們非常幸運,在這輪融資中,Light Street 在技術特定投資方面的深厚專業知識以及 Advent 強大的私募和成長股權背景爲我們提供了支持。」
據相關資料顯示,Ayar Labs成立於 2015 年,公司團隊由來自英特爾、IBM、美光、Penguin、麻省理工學院、伯克利和斯坦福的許多頂尖技術專家組成。
在官網的介紹中,Ayar Labs將公司定位爲光學互連解決方案領域的領導者,其提供的產品數據傳輸速度與 AI 相當。公司表示,在意識到 AI 模型的複雜性和規模正在以傳統互連技術無法處理的速度增長,他們開發了業界首個光學 I/O 解決方案,使客戶能夠最大限度地提高不斷增長的 AI 基礎設施的計算效率和性能,同時降低成本、延遲和功耗。Ayar Labs指出,公司的光學 I/O 解決方案基於開放標準,並針對 AI 訓練和推理進行了優化,擁有強大的生態系統,使其能夠順利大規模集成到 AI 系統中。

如上圖所示,Ayar Labs 表示,公司故事的起源可以追溯到公司在2010年的發佈的一篇名爲《Open foundry platform for high-performance electronic-photonic integration》的論文。據介紹,該文章論述採用當時商用電子 45 nm SOI-CMOS 代工工藝製造的具有 3 dB/cm 波導損耗的光子器件。通過利用現有的前端製造工藝,光子器件與電子器件單片集成在與晶體管相同的物理器件層中,實現 4 ps 邏輯級延遲,而不會降低晶體管性能。
在文章中,他們展示了一個 8 通道光學微環諧振器濾波器組和光調製器,它們均由集成數字電路控制。通過開發一種不需要任何工藝基礎設施更改的器件設計方法,可以實現廣泛可用的高性能光子電子集成電路平台。

在文章的論述階段他們強調,論戰展示的電子-光子平台是一種可訪問的、低成本的利用現有電子代工廠基礎設施的方法,可用於製造高性能光子器件和最先進的 CMOS 晶體管。使用薄 SOI-CMOS 工藝無需進行代工廠內部改動,只需進行簡單的後處理即可實現良好的無源光子性能,消除了之前工作中存在的波導損耗瓶頸。文章介紹的濾波器組解複用器和調製器等設備,以及目前正在開發的集成光電探測器,構成了先進電子工藝中光子互連平台的基礎,該工藝可用於製造當今的微處理器。該代工平台的通用性質使我們可以使用最先進的技術,這將極大地促進整個 VLSI 和光子系統及應用領域的新型電光片上系統的研究。
正是基於這個研究,Ayar Labs在2015年宣告成立,然後在次年獲得了種子輪投資(GlobalFoundries 參與了種子輪融資)。
Ayar Labs,聚焦解決的問題
在具體介紹Ayar Labs的產品之前,我們先介紹一下他們具體想解決什麼問題。
正如之前很多報道中所說,高性能計算引擎存在帶寬和信號問題,這已經不是什麼祕密了。如果你想要以合理的每秒容量快速地將數據輸入和輸出,從而讓引擎中的數十到數萬個核心保持忙碌,那麼如果你要堅持使用銅線,就必須儘可能緊密地連接它們,無論是插入堆疊內存的插入器上的走線,還是進出 SerDes 的電線,以將計算引擎連接在一起以並行運行。
問題在於電線的長度過長。每次將帶寬增加一倍時,由於信號失真,您都必須將電線長度減半。這是物理學和材料科學的問題,每個人都知道最終銅線將被光纖取代。而且由於人工智能工作負載對帶寬的巨大需求,未來幾年內這似乎將真正成爲不可避免的趨勢。

Ayar Labs也正是這樣的「光」參與者,致力於打破過去的數據傳輸模式。
據了解,他們的目標是將光通信直接置於封裝上,而不是受到 IO 密度問題、數據速率擴展和電子封裝到封裝互連的功率低效性限制。Ayar Labs 的主要觀點是,在 1cm 到 10cm 的傳輸範圍內,光學 IO 比當前的電子系統更高效。解決數據傳輸功率膨脹問題的最佳方法是,只要您將數據傳輸到此距離以外,就切換到光學。

知名行業分析機構semianalysis表示,轉向共封裝光學器件有許多好處。例如數據不需要從處理器發送到網卡,也不需要通過昂貴的光收發器。處理器本身也可以節省大量成本,因爲不必將太多的芯片面積專用於大型高速電氣 SerDes。
鑑於 Ayar Labs 已加入開放的 UCIe 標準,Semianalysis認爲他們的芯片將使用該協議作爲與外部公司芯片接口的基礎層。UCIe 支持英特爾、ASE 和台積電的許多封裝選項。在處理器方面,英特爾、AMD、博通、美光、聯發科和 GUC 都是該聯盟的成員。UCIe 極大地降低了將第三方芯片集成到封裝中的進入門檻,這反過來應該會降低 Ayar Labs 獲得設計勝利的進入門檻。此外,Ayar Labs 也明確支持高密度扇出、英特爾的 EMIB 和其他硅中介層技術。

目前,Ayar Labs有兩種主要的產品:一是SuperNova 光源——這是封裝外部的遠程光源,可以將其視爲位於 ASIC 封裝外部某處的光電源;另一個是TeraPHY 光學 I/O 芯片,這種硅片包含約 7000 萬個晶體管和 10,000 多個光學器件。據介紹,他們將硅光子器件集成到 CMOS 工藝中,製成我們作爲芯片出售的硅片。該芯片集成到客戶 SOC 封裝中。

從官網可以看到,SuperNova遠程光源是 Ayar Labs 光學 I/O 解決方案的支柱,也是業界首款符合 CW-WDM MSA 標準的 16 波長光源,可提供多達 16 種波長的光併爲多達 16 個端口供電。與 Ayar Labs TeraPHY 光學 I/O 芯片組相結合,與傳統互連(可插拔光學器件 + 電氣 SerDes)相比,該解決方案可提供 5 至 10 倍的更高帶寬、10 倍的更低延遲和 4 至 8 倍的更高能效。光學 I/O 消除了 I/O 瓶頸,超越了工藝限制,併爲下一代 AI 架構釋放了創新架構。

TeraPHY光學 I/O 芯片組則是一種體積小、功耗低、吞吐量高的銅背板和可插拔光學通信替代方案。TeraPHY 芯片組的模塊化多端口設計可承載八個光通道(相當於 x8 PCIe Gen5 鏈路)。這款業界首創的光學 I/O 芯片組將硅光子學與標準 CMOS 製造工藝相結合。它適用於現有的系統級封裝架構,不需要 SoC 定製。
按照該公司CEO Mark Wade所說,Ayar Labs目前的主要商業模式是銷售實際產品。他表示,SOC領域已經發生了整個範式轉變,以推動 chiplet 的採用。如果你打開 ASIC 的蓋子,你會看到裏面有多個芯片。於是,Ayar Labs將所謂的「KGD」光學芯片裝入客戶的封裝中銷售。來到光學 I/O 芯片方面,Ayar Labs將其作爲創收產品銷售,客戶只需直接從我們這裏購買芯片即可。
Wade強調,Ayar Labs的市場策略專注於解決光子學領域的大批量、高質量製造問題。我們與 GlobalFoundries、Applied Materials、英特爾和台積電等主要公司建立了戰略合作關係,並與所有一線 CMOS 製造商展開合作。
Ayar Labs還與大型 AI 系統領域的領導者 Nvidia 建立了戰略合作伙伴關係,共同將我們的技術融入未來的 AI 系統。公司的直接客戶正在構建 SOC 和 SOC 系統,其一流生態系統包括 Nvidia、AMD、英特爾、博通和高通等公司。
「構建大規模 AI 模型的終端客戶(例如 Anthropic 和 OpenAI)至關重要。數據中心在嘗試擴展 AI 工作負載時出現了許多嚴重問題。我們發現,這些公司對未來的願景與我們多年來的預測相似,這證實了這一點。」Ayar Labs CEO Mark Wade強調。「我們的成功取決於能否進入這些領域。我們正在應對光子技術方面的挑戰,特別是在大批量、高質量製造方面。這種方法使我們能夠與行業主要參與者合作,同時滿足最終用戶的需求,從而突破人工智能技術的界限。」Mark Wade接着說。
Ayar Labs 今年八月曾表示,將發佈其光學 I/O 技術來取代芯片內的銅線。該公司正在開發將光學 I/O 放入芯片結構中的技術,並已研究該技術十多年。該技術允許芯片內部實現更快的通信,旨在取代速度較慢的銅線。
「藉助光學 I/O,你可以突破幾十米甚至幾百米的距離,然後連接更多的 GPU 或加速器,」Wade 說。
大規模商用在即?
在人們很容易認爲,Nvidia、AMD 和英特爾的投資預示着這些公司正在尋求以某種方式在其計算引擎中部署 TeraPHY 光學傳輸及其 SuperNova 激光源。我們知道,他們的早期投資者HPE早在 2022 年 2 月就與 Ayar Labs 達成了一項戰略投資和合作協議,將硅光子學添加到其「Rosetta」Slingshot 互連中。
但在回答The Next Platform諮詢時,Ayar Labs 商業運營副總裁 Terry Thorn 開玩笑說:「他們都是投資者和公司,我們正在與他們一起探索許多有趣的機會——其中大部分我們目前還不能談論。」我們可以想象這種情況會發生,但還有許多其他方法可以實現共封裝光學器件,這三家公司也都有發明自己產品的習慣。
換而言之,通過這些投資,這些芯片公司可能只是想更深入了解 Ayar Labs 正在做的事情。但正如Mark Wade在之前的採訪中所說,在很多場景中會需要使用光連接。
如他所說,當Ayar Labs剛開始研究這個問題時,許多早期見解都來自高性能計算社區——你知道,國家實驗室正在建造的大型機器。這些大型系統首先發現它們存在大量數據移動問題,這些問題開始成爲整個系統性能的瓶頸。這就是Ayar Labs稱之爲「煤礦中的金絲雀」的 2010 年至 2015 年的時間段,當時的現狀表明底層計算技術存在問題。
之後,隨着人工智能工作流程開始出現,以及圖像識別、推薦引擎等早期工作負載——但後來,特別是當轉換器模型上線並開始啓用新的人工智能應用程序時,我們進入了生成式人工智能時代。但關鍵是要意識到,構成這些人工智能計算系統骨幹的計算系統看起來像高性能計算架構。
「因此,十年前在高性能計算中發生的相同數據移動挑戰現在開始出現在人工智能系統中,併成爲整個系統性能的瓶頸。」Mark Wade強調。
Mark Wade指出,這是一個多方面的問題。您必須讓人們在功率受限的情況下將更多帶寬傳輸到更長的距離。因此,這些系統的功率限制並不是無限的。每個級別都存在熱和功率密度問題 - 芯片級、封裝級、系統板級、機架級。因此,每個級別都存在功率問題。延遲是您必須更仔細檢查的地方。
「如今,人們使用銅線和電氣 I/O 以電氣方式傳輸高帶寬的方式,您往往會做一些事情,例如添加糾錯,因爲您要嘗試恢復在以電氣方式傳輸數據時發生的所有低效率和數據損壞。在光學方面,您可以以一種優雅的方式解決這個問題,從而擺脫糾錯。因此,您可以獲得更輕量級的糾錯架構,但這會影響延遲。」Mark Wade說。
爲了實現上述目標,Ayar Labs一直在豐富其產品線。
如果你看一下路線圖,就會發現Ayar Labs每隔幾年就會將每個芯片的帶寬翻一番。他們的計劃從 4 Tbps 增加到 8 Tbps,然後是 16Tbps 和 32 Tbps,這是每個芯片的帶寬。Ayar Labs還下調了一些向量——每個芯片的帶寬、每個封裝實例化多個芯片的能力、擴大整個封裝級別帶寬以及可以從封裝中釋放的帶寬基數。Ayar Labs的客戶通常關注我們可以從他們的封裝中釋放多少帶寬,以及在什麼樣的功率密度約束下。特別是隨着人工智能系統的發展,每個封裝中更高的帶寬釋放變得越來越重要,同時也提高了連接的基數。
目前,Ayar Labs的每個芯片有 8 個端口,每個芯片組有 8 個端口。假設每個封裝有 4 個芯片組,則您的連接端口爲 32 個,您可以將所有這些端口連接到不同的地方。
展望未來,Wade表示:「我們目前在實驗室中與客戶共同開展的工作,實際上是爲了在兩到三年後實現首次大規模市場部署。」
寫在最後
其實光學並不是一項新技術——光纖真正進入技術領域是在 70 年代。我們開始建造海底電纜和類似的東西,最終連接互聯網。光學技術是衆所周知的。
但是將數據直接以光學方式從計算包中移出的需求實際上是一個相當新的現象,這與電氣 I/O 問題的惡化速度有關。我們的應用程序需要更高的帶寬和更好的能效——這開始打破現有的基於電氣 I/O 的系統。但挑戰在於,你不能只把人們使用的技術和產品用於人們可能熟悉的更標準化的解決方案,例如使用以太網的可插拔收發器。如果我在數據中心內移動 100 Gbps、400 Gbps 或 800 Gbps,那麼這些已經是光學可插拔收發器了。問題是,如果你打開這些收發器並查看裏面的東西,你會發現它們沒有直接擴展到計算結構的特性。
因此,要實現上述目標,除了要面對尺寸、元件數量、成本結構,以及所有這些組件的組裝方式外。還有功率效率、熱靈敏度等問題,還有「我不能直接將收發器放入計算機封裝中」的一系列問題。
「因此,我們必須從頭開始發明一種具有正確底層特性的技術:密度、設備尺寸、能源效率,更重要的是,能夠集成到製造工藝中,從而在 CMOS 規模下運行。我們必須掌握如何將該技術納入封裝,因爲這是一種真正大規模的應用。所有這些特性在每一步都是挑戰,我們公司的一部分,以及我們多年來所努力的一部分,實際上是在一步步解決這些問題。」Mark Wade表示。
面向這個市場和機會,除了Ayar Labs以外,Lightmatter、Celestial AI 、Eliyan以及國內的曦智和一大堆的處理器、晶圓廠和封裝廠都在努力,爲硅光子學成爲計算引擎和互連之間的橋樑各出奇招。
編輯/jayden