share_log

AMD的革命性芯片

AMD的革命性芯片

如果您希望可以時常見面,歡迎標星 收藏哦~

來源:內容由半導體行業觀察(ID:icbank)編譯自tomshardware,謝謝。

AMD Instinct MI300A APU 的工程師們發表了關於打造“百億億次異構處理”未來的研究成果。MI300A 是 El Capitan 的核心處理器,預計今年開始運行後將成爲世界上速度最快的超級計算機。預計它的運行速度將達到每秒 2 百億億次浮點運算。

13 位 AMD 科學家在最近的研究論文中合作,建立了實現百億億次浮點性能的方法和手段。上面來自 X的帖子提供了研究過程的絕佳鳥瞰圖,由該論文的一位作者發佈。雖然 MI300A 的存在無疑不是什麼新鮮事,它於 2023 年 5 月首次爲公衆所知,但昨天在 ISCA 2024 上發表的新論文有助於揭示詳細的製作過程——正是 AMD 的想法讓他們優先考慮 APU 而不是專用 GPU 進行百億億次計算。

十多年前,美國能源部選擇 AMD 參與超級計算機研究,Instinct MI300A 應運而生。美國能源部期待超級計算機以百億億次浮點運算的速度運行,但隨着摩爾定律即將終結,它知道必須進行更深刻的創新才能實現這一目標。儘管功能強大,但 AMD 認爲獨立顯卡會帶來太多空間限制和功耗,無法實現可擴展和百億億次級。因此,它開始研究“百億億次級異構處理器”。EHP 項目基於打造一款能夠與自身多個副本同步的強大企業級APU,它首先體現在 Frontier 中,這是世界上第一臺達到百億億次浮點運算速度的超級計算機。

儘管 Frontier 超級計算機在首次推出時就取得了巨大成功,成爲世界上速度最快的超級計算機,但 AMD 並未完全實現其 EHP 計劃。Frontier 基於 EHP 研究的基礎,但使用專用的 MI250X 圖形加速器,而不是 AMD 希望的一體式 APU 解決方案。爲了按時推出 Frontier,必須做出這種犧牲,因爲 AMD 的 V-Cache 堆疊技術雖然前景光明,但尚未準備好迎接黃金時段。Frontier 期間計劃的 EHP 第三次修訂版需要在每個 GPU 芯片頂部堆疊 HBM 模塊,以及其他當時不可能完成的任務。3D V-Cache 不得不等待更長時間,這意味着 Frontier 推出時狀態並不完美,但功能強大。

最終,3D V-Cache 成爲了如今的革命性技術,EHP 也準備好衝過終點線。這款新的 APU 是基於 Frontier 內部 EPYC 處理器的 CPU 架構而誕生的。藉助統一的 Infinity Fabric 內存總線,MI300A 最終可以在其圖形和處理核心之間實現以 TB/s 爲單位的傳輸時間。

作爲 EHP 項目的最終形態,MI300A 絕非玩笑。APU 擁有 24 個 Zen 4 x86 CPU 核心(分佈在三個芯片中),以及 228 個 CDNA 3 GPU 計算單元和 128 GB 統一 HBM3 內存(運行速度爲 5.2 GT/s),全部融入第四代 Infinity 架構中。其規格表上的數字似乎是拼寫錯誤,峯值內存帶寬爲 5.3 TB/s,理論峯值 AI 性能爲 3922 TFLOPS(此處插入三個不同的免責聲明)。

MI300A APU 上的 GPU 性能大大高於 Frontier 中 MI250X 的專用 GPU 性能。在一系列 HPC 工作負載綜合基準測試中,MI300A 的輸出結果比 MI250X 快 1.25 倍到 2.75 倍。平均性能翻倍無疑證明了 AMD 和能源部爭取 EHP 是正確的。

當然,MI300A 並非獨立運行,因爲它設計用於四個 APU 陣列。每個 APU 都有八個 128 GB/s Infinity Fabric 接口,可實現 1 TB/s 的雙向連接。在四個 APU 的配置中,每個 APU 都可以快速通信,同時所有 APU 都具有 PCIe Gen5 x16 連接。將其擴展到超級計算機,能源部最新的玩具 El Capitan 估計可以以 2 exaFLOPS 的速度運行。

El Capitan 部署後將碾壓全球頂級超級計算機。採用 AMD 技術的 Frontier 仍然是世界上最快的超級計算機,峯值速度爲 1.2 exaFLOPS。只有一臺計算機達到了 1 exaFLOPS,其餘計算機的速度都在 500 teraFLOPS 或更低。El Capitan 的預期結果將輕鬆奪得第一,成爲目前全球前 10 名排行榜上的第三臺採用 AMD 技術的超級計算機。

譯文內容由第三人軟體翻譯。


以上內容僅用作資訊或教育之目的,不構成與富途相關的任何投資建議。富途竭力但無法保證上述全部內容的真實性、準確性和原創性。
    搶先評論