share_log

这一新型内存技术,优势显著

這一新型內存技術,優勢顯著

半導體行業觀察 ·  10/06 10:37

如果您希望可以時常見面,歡迎標星 收藏哦~

來源:內容編譯自nextplatform ,謝謝。

根據英特爾內部分析,英特爾最近展示了一種稱爲多路複用器組合列 (MCR)(也稱爲 MRDIMM)的新型 DIMM 內存技術,與第五代英特爾至強處理器相比,該技術可爲 HPC 工作負載提供高達 2.3 倍的性能提升,爲 AI 推理工作負載提供高達 2 倍的性能提升。

英特爾副總裁兼 Xeon 6 產品總經理Matt Langman最近介紹了運行HPC工作負載 Nemo(歐洲海洋建模核心)的新技術。Nemo是一種模擬工作負載,用於模擬海洋溫度、海平面變化、鹽度和其他熱力學和生物地球化學指標。英特爾兩週前推出的帶有 P 核的 Xeon 6 CPU(俗稱「Granite Rapids」 )與MCR內存相結合,與採用傳統DDR內存的第五代英特爾「Sapphire Rapids」Xeon SP相比,運行速度提高2.3倍。基於英特爾內存控制器的創新以及更多內核和內存通道,高帶寬MRDIMM技術可顯著提升性能。

英特爾戰略規劃師 Nate Mather 解釋了這種更快內存技術對許多客戶的價值主張,他指出:「與 DDR5 RDIMM 相比,MRDIMM 可提供更大的帶寬提升,爲客戶提供一個有趣的新選擇點。在現有平台上,性能大幅提升 30% 到 40%,讓客戶能夠靈活地選擇他們的 AI 和 HPC 工作負載。」

l 績效預測與驗證

截至 5 月份的英特爾性能預測表明,12 個通道的 MRDIMM 內存與架構增強相結合意味着最新的英特爾至強處理器(代號 Granite Rapids)將爲 HPC 和 AI 工作負載提供整體性能提升。

這已被實踐所證明。

在德國漢堡舉行的 2024 年國際超級計算大會 (ISC) 上,英特爾發佈了多項公告,包括報告早期性能結果,結果表明,與上一代系統相比,MRDIMM 配置系統可爲 NEMO 等實際 HPC 應用程序提供高達 2.3 倍的性能提升。這表明,新技術爲 HPC 解決方案的首選主機 CPU 奠定了堅實的基礎。

美光科技證實,其最近發佈的 64 GB、96 GB 和 128 GB 容量的 MRDIMM 模塊與 RDIMM 相比,平均帶寬增幅達到或超過了 1.3 倍。

l 平台兼容——無需更改軟件

在兩排 DDR5 內存之間添加數據緩衝區(如下所示)意味着可以封裝和訪問 MR 內存技術,從而與 DDR5 RDIMM 完全平台兼容,同時還具有一系列新處理器功能:

ž 對於當前系統,MRDIMM 模塊能夠同時訪問單個內存芯片,正如英特爾在英特爾 Hot Chips 2023 演示文稿第 9 張幻燈片中指出的那樣。這些 MRDIMM可以比 6400 個 RDIMM 實現多 37% 以上的帶寬。

ž 當 MRDIMM 同時操作兩排 DDR5 內存並向 CPU 提供 128 個字節(每排 64 個字節)時,其帶寬魔力便會顯現出來。這意味着 CPU 可以以高於傳統 DDR5 RDIMM 的速率執行突發操作,在雙插槽系統中實現超過 1.5 TB/秒的內存帶寬能力。通過以 2 倍 DRAM 速度操作 CPU 到 MRDIMM 接口來實現更高的帶寬,每個 DRAM 排都能夠在每個週期發送或接收數據。此外,它還爲 CPU 提供了多達 12 個內存通道和一系列 Intel Xeon 架構改進(其中許多改進提供了更多未完成的內存請求和預取功能),從而提高了性能。

ž 最新的英特爾至強處理器(代號爲 Granite Rapids)將支持非常高的核心數,新技術可提供 1S-8S 的可擴展性以及每個通道最多 2 個 RDIMMS 或 MRDIMM。

l DDR5 外形兼容性

英特爾數據中心和 AI 部門 Xeon 產品經理 Bhanu Jaiswal 表示:「MRDIMM 在外形尺寸上與當今的 DDR5 RDIMM 兼容。您無需重新設計系統板或犧牲任何 DDR5 可靠性、可用性和可維護性 (RAS) 功能。無需對軟件進行任何更改。簡而言之,在相同的系統設計中提供更多帶寬。」當然, DDR5 RAS 功能在現代服務器中是絕對必要的。

Jaiswal 表示,HPC 的優勢在於支持 MRDIMM 的 Intel Xeon 新內存技術將使大多數內存帶寬受限的工作負載受益。對於 HPC 工作負載,這一點在許多技術文章中都有體現。

更高的內存帶寬意味着處理器可以讓更多內核保持活躍,以完成更多有用的工作(例如,更好的性能)。帶寬的提升對於滿足現代 CPU 快速增長的內核數量以及確保內核得到有效利用至關重要。內存帶寬的增加還有利於英特爾爲支持各種 AI、HPC 和數據中心工作負載而開發的其他性能特性。

英特爾即將推出的 AVX10 融合矢量 ISA包含針對深度學習和 HPC 工作負載的改進,這些工作負載受益於矢量處理,例如科學模擬和數據分析。較大的寄存器大小意味着 CPU 內核可以在一個時鐘週期內對多個數據執行相同的操作,而不必對較小的數據執行多個週期。MRDIMMS 將在提供數據以保持此矢量 ISA 繁忙方面非常有用。AVX10 版本 1 將僅在 Granite Rapids Xeon 6 CPU 中推出,完整版本將在後續幾代中得到支持。

因此,當您查看服務器時,請記住,內存帶寬是許多工作負載(包括 AI 和 HPC 領域中的工作負載)的首要性能限制因素,但僅靠內存帶寬不足以滿足許多客戶工作負載的需求。這就是 Xeon 6 處理器內部採用片上增強型模塊化網格和優化內核的原因,與上一代 Xeon 處理器相比,預計其性能將提高 2 到 3 倍。更妙的是,增加的內存帶寬有助於釋放在越來越多的 CPU 內核數量下運行這些關鍵工作負載所需的性能。

譯文內容由第三人軟體翻譯。


以上內容僅用作資訊或教育之目的,不構成與富途相關的任何投資建議。富途竭力但無法保證上述全部內容的真實性、準確性和原創性。
    搶先評論