追蹤AI最新趨勢

超越英偉達H100！英特爾推出新一代AI芯片Gaudi 3，大模型訓練推理能力強化50%

来源：硬AI 作者：李丹

英特尔称，Gaudi 3可将Llama2和GPT-3模型的训练时间较H100平均缩短50%，将Llama和Falcon模型的推理吞吐量较H100平均提高50%、推理速度较英伟达H200提高30%。英特尔还推出第六代志强（Xeon）处理器，宣布谷歌云将运用其机密计算功能，将与多家企业合作打造企业AI的开放平台。

英伟达的人工智能（AI）霸主地位面临新挑战，英特尔推出号称性能明显优于英伟达竞品的新一代AI芯片。

美东时间4月9日周二，在今年举办的客户与合作伙伴大会Intel Vision 2024期间，英特尔正式发布第三代英特尔AI加速器Gaudi 3。英特尔称，它将为企业应用生成式AI带来高性能、开放性和新选择。同时，英特尔还推出了一套全新的开放式可扩展系统、下一代产品和战略合作，加快生成式AI的应用。

去年发布新一代AI数据中心和个人电脑（PC）芯片新品时，英特尔CEO基辛格（Pat Gelsinger）就预告过，将推出用于深度学习和大型生成式AI模型的Gaudi 3。英特尔当时称，Gaudi 3的性能将优于英伟达的主打AI芯片H100。

本周二，基辛格在Intel Vision 2024大会上表示：“创新正在以前所未有的速度前进，这一切都是由芯片推动的——每家公司都在迅速成为AI公司。英特尔正在将AI带到整个企业的各个角落，从个人电脑（PC ）到数据中心再到边缘（计算）。我们（英特尔）最新的 Gaudi、至强（Xeon）和 Core 酷睿（Core）平台正在提供一套紧密结合的灵活解决方案，旨在满足客户和合作伙伴不断变化的需求，并充分利用未来的巨大机遇。”

Gaudi可将模型训练时间较H100缩短50%、推理吞吐量提高50%

英特尔介绍，Gaudi 3采用5纳米工艺制造，专为高效的大规模 AI 计算而设计，将为AI系统提供通过通用以太网标准连接的数以万计加速器支持。对于那些希望大规模配置生成式AI的企业来说，在大语言模型（LLM）和多模态模型的AI训练和推理方面，Gaudi 3可以实现性能和生产率的大飞跃。

英特尔称，对比前代，Gaudi 3可提供四倍的浮点格式BF16 AI计算能力，内存带宽提升1.5倍，服务于大规模系统扩展的网络带宽提升两倍。

对比英伟达的芯片H100，如果应用于7B和13B参数的Meta Llama2 模型以及175B参数的OpenAI GPT-3模型中，Gaudi 3预计可以让这些模型的训练时间平均缩短50%。

此外，应用于7B和70B参数的Llama以及180B参数的开源Falcon模型时，Gaudi 3的推理吞吐量预计将比H100平均高50%，推理功效平均高40%。而且，在较长的输入和输出序列上，Gaudi 3有更大的推理性能优势。

应用于7B和70B参数的Llama以及180B参数的Falcon模型时，Gaudi 3的推理速度相比英伟达H200提高30%。

英特尔称，Gaudi 3将在今年第三季度向客户供应，二季度向包括戴尔、HPE、联想和Supermicro在内的 OEM 厂商提供，但并未公布Gaudi 3的售价范围。

主管至强软件的英特尔副总裁 Das Kamhout称，英特尔预计，面对英伟达的最新产品，英特尔的Gaudi 3料将有很强的竞争力，“从我们具有竞争力的价格、我们独特的开放式集成片上网络来看，我们正在使用行业标准以太网。我们相信这是一个强大的产品。”

英特尔AI解决方案客户包括IBM等谷歌云将运用机密计算功能

在Intel Vision 2024期间，英特尔介绍其开放可扩展AI系统的战略，包括硬件、软件、框架和工具。

英特尔称，这种方式让AI领域的参与者能建立了广泛、开放的生态系统，从而提供满足企业特定生成式AI需求的解决方案。英特尔战略服务的客户包括设备制造商、数据库提供商、系统集成商、软件和服务提供商等，比如使用Gaudi芯片的NAVER、在其数据库应用第五代至强处理器的IBM、将与印度客户合作打造AI超级计算机的CtrlS Group。

英特尔还宣布与谷歌云、Thales 和 Cohesity 合作，这三家合作方将在其云实例中运用英特尔的机密计算功能。

与多家企业合作打造企业AI的开放平台

Intel Vision 2024期间，英特尔还宣布与 Anyscale、Articul8、DataStax、Domino、Hugging Face、KX Systems、MariaDB、MinIO、Qdrant、红帽（RedHat）、Redis、SAP、VMware、Yellowbrick 和 Zilliz 合作，有意为企业AI创建一个开放平台。

英特尔称，这种全行业的努力旨在开发开放的多供应商生成式AI系统，通过检索增强生成（RAG）让企业用户达到一流的性能且易于部署生成式AI。在RAG加持的生态系统，通过开放的 LLM 功能，企业能增强在标准云基础设施上运行大量现有专有数据源的能力，从而加快生成式AI在企业的应用。

作为这项工作的第一步，英特尔将在基于安全英特尔至强和Gaudi 的解决方案发布生成式AI管道的参考实现，发布技术概念框架，并继续在英特尔 Tiber 开发者云中增加基础设施容量，以实现RAG的生态系统开发和验证以及未来的管道。

发布面向企业AI的第六代志强（Xeon）处理器

除了Gaudi 3加速器，英特尔还发布了另一硬件：第六代志强（Xeon）处理器。它提供高性能的解决方案，运行包括RAG在内的当前生成式AI解决方案。面向所有企业AI，将于今年第二季度问世。

英特尔介绍，相比二代英特尔至强处理器，代号Sierra Forest的E核六代志强处理器每瓦性能提高四倍，机架密度提高 2.7 倍。

代号 Granite Rapids的P核六代志强处理器纳入对 MXFP4 数据格式的软件支持，相比使用 FP16 的第四代至强处理器，它的下一个token延迟最多可减少6.5 倍，并且能运行 700 亿个参数的 Llama-2模型。

编辑/lambor

來源：硬AI 作者：李丹

英特爾稱，Gaudi 3可將Llama2和GPT-3模型的訓練時間較H100平均縮短50%，將Llama和Falcon模型的推理吞吐量較H100平均提高50%、推理速度較英偉達H200提高30%。英特爾還推出第六代志強（Xeon）處理器，宣佈谷歌雲將運用其機密計算功能，將與多家企業合作打造企業AI的開放平台。

英偉達的人工智能（AI）霸主地位面臨新挑戰，英特爾推出號稱性能明顯優於英偉達競品的新一代AI芯片。

美東時間4月9日週二，在今年舉辦的客戶與合作伙伴大會Intel Vision 2024期間，英特爾正式發佈第三代英特爾AI加速器Gaudi 3。英特爾稱，它將爲企業應用生成式AI帶來高性能、開放性和新選擇。同時，英特爾還推出了一套全新的開放式可擴展系統、下一代產品和戰略合作，加快生成式AI的應用。

去年發佈新一代AI數據中心和個人電腦（PC）芯片新品時，英特爾CEO基辛格（Pat Gelsinger）就預告過，將推出用於深度學習和大型生成式AI模型的Gaudi 3。英特爾當時稱，Gaudi 3的性能將優於英偉達的主打AI芯片H100。

本週二，基辛格在Intel Vision 2024大會上表示：“創新正在以前所未有的速度前進，這一切都是由芯片推動的——每家公司都在迅速成爲AI公司。英特爾正在將AI帶到整個企業的各個角落，從個人電腦（PC ）到數據中心再到邊緣（計算）。我們（英特爾）最新的 Gaudi、至強（Xeon）和 Core 酷睿（Core）平台正在提供一套緊密結合的靈活解決方案，旨在滿足客戶和合作夥伴不斷變化的需求，並充分利用未來的巨大機遇。”

Gaudi可將模型訓練時間較H100縮短50%、推理吞吐量提高50%

英特爾介紹，Gaudi 3採用5納米工藝製造，專爲高效的大規模 AI 計算而設計，將爲AI系統提供通過通用以太網標準連接的數以萬計加速器支持。對於那些希望大規模配置生成式AI的企業來說，在大語言模型（LLM）和多模態模型的AI訓練和推理方面，Gaudi 3可以實現性能和生產率的大飛躍。

英特爾稱，對比前代，Gaudi 3可提供四倍的浮點格式BF16 AI計算能力，內存帶寬提升1.5倍，服務於大規模系統擴展的網絡帶寬提升兩倍。

對比英偉達的芯片H100，如果應用於7B和13B參數的Meta Llama2 模型以及175B參數的OpenAI GPT-3模型中，Gaudi 3預計可以讓這些模型的訓練時間平均縮短50%。

此外，應用於7B和70B參數的Llama以及180B參數的開源Falcon模型時，Gaudi 3的推理吞吐量預計將比H100平均高50%，推理功效平均高40%。而且，在較長的輸入和輸出序列上，Gaudi 3有更大的推理性能優勢。

應用於7B和70B參數的Llama以及180B參數的Falcon模型時，Gaudi 3的推理速度相比英偉達H200提高30%。

英特爾稱，Gaudi 3將在今年第三季度向客戶供應，二季度向包括戴爾、HPE、聯想和Supermicro在內的 OEM 廠商提供，但並未公佈Gaudi 3的售價範圍。

主管至強軟件的英特爾副總裁 Das Kamhout稱，英特爾預計，面對英偉達的最新產品，英特爾的Gaudi 3料將有很強的競爭力，“從我們具有競爭力的價格、我們獨特的開放式集成片上網絡來看，我們正在使用行業標準以太網。我們相信這是一個強大的產品。”

英特爾AI解決方案客戶包括IBM等谷歌雲將運用機密計算功能

在Intel Vision 2024期間，英特爾介紹其開放可擴展AI系統的戰略，包括硬件、軟件、框架和工具。

英特爾稱，這種方式讓AI領域的參與者能建立了廣泛、開放的生態系統，從而提供滿足企業特定生成式AI需求的解決方案。英特爾戰略服務的客戶包括設備製造商、數據庫提供商、系統集成商、軟件和服務提供商等，比如使用Gaudi芯片的NAVER、在其數據庫應用第五代至強處理器的IBM、將與印度客戶合作打造AI超級計算機的CtrlS Group。

英特爾還宣佈與谷歌雲、Thales 和 Cohesity 合作，這三家合作方將在其雲實例中運用英特爾的機密計算功能。

與多家企業合作打造企業AI的開放平台

Intel Vision 2024期間，英特爾還宣佈與 Anyscale、Articul8、DataStax、Domino、Hugging Face、KX Systems、MariaDB、MinIO、Qdrant、紅帽（RedHat）、Redis、SAP、VMware、Yellowbrick 和 Zilliz 合作，有意爲企業AI創建一個開放平台。

英特爾稱，這種全行業的努力旨在開發開放的多供應商生成式AI系統，通過檢索增強生成（RAG）讓企業用戶達到一流的性能且易於部署生成式AI。在RAG加持的生態系統，通過開放的 LLM 功能，企業能增強在標準雲基礎設施上運行大量現有專有數據源的能力，從而加快生成式AI在企業的應用。

作爲這項工作的第一步，英特爾將在基於安全英特爾至強和Gaudi 的解決方案發布生成式AI管道的參考實現，發佈技術概念框架，並繼續在英特爾 Tiber 開發者雲中增加基礎設施容量，以實現RAG的生態系統開發和驗證以及未來的管道。

發佈面向企業AI的第六代志強（Xeon）處理器

除了Gaudi 3加速器，英特爾還發布了另一硬件：第六代志強（Xeon）處理器。它提供高性能的解決方案，運行包括RAG在內的當前生成式AI解決方案。面向所有企業AI，將於今年第二季度問世。

英特爾介紹，相比二代英特爾至強處理器，代號Sierra Forest的E核六代志強處理器每瓦性能提高四倍，機架密度提高 2.7 倍。

代號 Granite Rapids的P核六代志強處理器納入對 MXFP4 數據格式的軟件支持，相比使用 FP16 的第四代至強處理器，它的下一個token延遲最多可減少6.5 倍，並且能運行 700 億個參數的 Llama-2模型。

編輯/lambor

譯文內容由第三人軟體翻譯。

以上內容僅用作資訊或教育之目的，不構成與富途相關的任何投資建議。富途竭力但無法保證上述全部內容的真實性、準確性和原創性。