share_log

超越英伟达H100!英特尔推出新一代AI芯片Gaudi 3,大模型训练推理能力强化50%

超越英偉達H100!英特爾推出新一代AI芯片Gaudi 3,大模型訓練推理能力強化50%

華爾街見聞 ·  04/10 07:01

來源:硬AI 作者:李丹

英特爾稱,Gaudi 3可將Llama2和GPT-3模型的訓練時間較H100平均縮短50%,將Llama和Falcon模型的推理吞吐量較H100平均提高50%、推理速度較英偉達H200提高30%。英特爾還推出第六代志強(Xeon)處理器,宣佈谷歌雲將運用其機密計算功能,將與多家企業合作打造企業AI的開放平台。

英偉達的人工智能(AI)霸主地位面臨新挑戰,英特爾推出號稱性能明顯優於英偉達競品的新一代AI芯片。

美東時間4月9日週二,在今年舉辦的客戶與合作伙伴大會Intel Vision 2024期間,英特爾正式發佈第三代英特爾AI加速器Gaudi 3。英特爾稱,它將爲企業應用生成式AI帶來高性能、開放性和新選擇。同時,英特爾還推出了一套全新的開放式可擴展系統、下一代產品和戰略合作,加快生成式AI的應用。

去年發佈新一代AI數據中心和個人電腦(PC)芯片新品時,英特爾CEO基辛格(Pat Gelsinger)就預告過,將推出用於深度學習和大型生成式AI模型的Gaudi 3。英特爾當時稱,Gaudi 3的性能將優於英偉達的主打AI芯片H100。

本週二,基辛格在Intel Vision 2024大會上表示:“創新正在以前所未有的速度前進,這一切都是由芯片推動的——每家公司都在迅速成爲AI公司。英特爾正在將AI帶到整個企業的各個角落,從個人電腦(PC )到數據中心再到邊緣(計算)。 我們(英特爾)最新的 Gaudi、至強(Xeon)和 Core 酷睿(Core)平台正在提供一套緊密結合的靈活解決方案,旨在滿足客戶和合作夥伴不斷變化的需求,並充分利用未來的巨大機遇。”

Gaudi可將模型訓練時間較H100縮短50%、推理吞吐量提高50%

英特爾介紹,Gaudi 3採用5納米工藝製造,專爲高效的大規模 AI 計算而設計,將爲AI系統提供通過通用以太網標準連接的數以萬計加速器支持。對於那些希望大規模配置生成式AI的企業來說,在大語言模型(LLM)和多模態模型的AI訓練和推理方面,Gaudi 3可以實現性能和生產率的大飛躍。

英特爾稱,對比前代,Gaudi 3可提供四倍的浮點格式BF16 AI計算能力,內存帶寬提升1.5倍,服務於大規模系統擴展的網絡帶寬提升兩倍。

對比英偉達的芯片H100,如果應用於7B和13B參數的Meta Llama2 模型以及175B參數的OpenAI GPT-3模型中,Gaudi 3預計可以讓這些模型的訓練時間平均縮短50%。

此外,應用於7B和70B參數的Llama以及180B參數的開源Falcon模型時,Gaudi 3的推理吞吐量預計將比H100平均高50%,推理功效平均高40%。而且,在較長的輸入和輸出序列上,Gaudi 3有更大的推理性能優勢。

應用於7B和70B參數的Llama以及180B參數的Falcon模型時,Gaudi 3的推理速度相比英偉達H200提高30%。

英特爾稱,Gaudi 3將在今年第三季度向客戶供應,二季度向包括戴爾、HPE、聯想和Supermicro在內的 OEM 廠商提供,但並未公佈Gaudi 3的售價範圍。

主管至強軟件的英特爾副總裁 Das Kamhout稱,英特爾預計,面對英偉達的最新產品,英特爾的Gaudi 3料將有很強的競爭力,“從我們具有競爭力的價格、我們獨特的開放式集成片上網絡來看,我們正在使用行業標準以太網。 我們相信這是一個強大的產品。”

英特爾AI解決方案客戶包括IBM等 谷歌雲將運用機密計算功能

在Intel Vision 2024期間,英特爾介紹其開放可擴展AI系統的戰略,包括硬件、軟件、框架和工具。

英特爾稱,這種方式讓AI領域的參與者能建立了廣泛、開放的生態系統,從而提供滿足企業特定生成式AI需求的解決方案。英特爾戰略服務的客戶包括設備製造商、數據庫提供商、系統集成商、軟件和服務提供商等,比如使用Gaudi芯片的NAVER、在其數據庫應用第五代至強處理器的IBM、將與印度客戶合作打造AI超級計算機的CtrlS Group。

英特爾還宣佈與谷歌雲、Thales 和 Cohesity 合作,這三家合作方將在其雲實例中運用英特爾的機密計算功能。

與多家企業合作打造企業AI的開放平台

Intel Vision 2024期間,英特爾還宣佈與 Anyscale、Articul8、DataStax、Domino、Hugging Face、KX Systems、MariaDB、MinIO、Qdrant、紅帽(RedHat)、Redis、SAP、VMware、Yellowbrick 和 Zilliz 合作,有意爲企業AI創建一個開放平台。

英特爾稱,這種全行業的努力旨在開發開放的多供應商生成式AI系統,通過檢索增強生成(RAG)讓企業用戶達到一流的性能且易於部署生成式AI。在RAG加持的生態系統,通過開放的 LLM 功能,企業能增強在標準雲基礎設施上運行大量現有專有數據源的能力,從而加快生成式AI在企業的應用。

作爲這項工作的第一步,英特爾將在基於安全英特爾至強和Gaudi 的解決方案發布生成式AI管道的參考實現,發佈技術概念框架,並繼續在英特爾 Tiber 開發者雲中增加基礎設施容量,以實現RAG的生態系統開發和驗證以及未來的管道。

發佈面向企業AI的第六代志強(Xeon)處理器

除了Gaudi 3加速器,英特爾還發布了另一硬件:第六代志強(Xeon)處理器。它提供高性能的解決方案,運行包括RAG在內的當前生成式AI解決方案。面向所有企業AI,將於今年第二季度問世。

英特爾介紹,相比二代英特爾至強處理器,代號Sierra Forest的E核六代志強處理器每瓦性能提高四倍,機架密度提高 2.7 倍。

代號 Granite Rapids的P核六代志強處理器納入對 MXFP4 數據格式的軟件支持,相比使用 FP16 的第四代至強處理器,它的下一個token延遲最多可減少6.5 倍,並且能運行 700 億個參數的 Llama-2模型。

編輯/lambor

譯文內容由第三人軟體翻譯。


以上內容僅用作資訊或教育之目的,不構成與富途相關的任何投資建議。富途竭力但無法保證上述全部內容的真實性、準確性和原創性。
    搶先評論