追蹤AI最新趨勢

英偉達AI盛會GTC揭幕，最強AI芯片Blackwell來了！

来源：华尔街见闻作者：李丹

英伟达称，Blackwell的成本和能耗较前代改善25倍，是全球最强大芯片，由 2080 亿个晶体管组成，采用台积电4nm制程，支持多达10万亿参数的模型进行AI训练和实时大语言模型（LLM）推理；GB200 NVL72推理性能较H100提升高达30倍；亚马逊、微软、谷歌和甲骨文在首批提供Blackwell支持的云服务商之列；台积电和Synopsys将采用英伟达计算光刻技术；英伟达推出新软件NIM，让用户更容易利用已有英伟达GPU进行AI推理。

号称今年全球头号人工智能（AI）领域开发者大会的英伟达2024 GTC AI大会于美东时间3月18日周一拉开帷幕。

今年是英伟达时隔五年首次让年度GTC重回线下，也是此前分析认为英伟达要“拿出点真家伙”的AI盛会。

当地时间周一下午，英伟达创始人兼CEO 黄仁勋在美国加州圣何塞SAP中心进行主题为“面向开发者的1#AI峰会”（1# AI Conference for Developers）演讲。

Blackwell成本和能耗较前代改善25倍全球最强大芯片台积电4 nm制程

黄仁勋介绍了运行AI模型的新一代芯片和软件。英伟达正式推出名为Blackwell的新一代AI图形处理器（GPU），预计将在今年晚些时候发货。

Blackwell平台能够在万亿参数级的大型语言模型（LLM）上构建和运行实时生成式 AI，而成本和能耗比前代改善25倍。

英伟达称，Blackwell拥有六项革命性的技术，可以支持多达10万亿参数的模型进行AI训练和实时LLM推理：

全球最强大的芯片：Blackwell 架构 GPU由 2080 亿个晶体管组成，采用量身定制的台积电4纳米（nm）工艺制造，两个reticle极限GPU裸片将10 TB/秒的芯片到芯片链路连接成单个统一的GPU 。
第二代 Transformer引擎：结合了Blackwell Tensor Core技术和TensorRT-LLM和 NeMo Megatron 框架中的英伟达先进动态范围管理算法，Blackwell 将通过新的4位浮点AI 支持双倍的计算和模型大小推理能力。
第五代 NVLink：为提高数万亿参数和混合专家AI 模型的性能，最新一代英伟达NVLink为每个 GPU 提供了突破性的 1.8TB/s 双向吞吐量，确保最复杂LLM之间多达576 个GPU 之间的无缝高速通信。
RAS 引擎：Blackwell 支持的 GPU 包含一个专用引擎，实现可靠性、可用性和服务性。此外，Blackwell 架构还增加了芯片级功能，利用基于AI的预防性维护进行诊断和预测可靠性问题。这可以最大限度地延长系统正常运行时间，并提高大部署规模AI的弹性，使其能连续运行数周甚至数月，并降低运营成本。
安全人工智能：先进的机密计算功能可在不影响性能的情况下保护AI模型和客户数据，并支持新的本机接口加密协议，这对于医疗保健和金融服务等隐私敏感行业至关重要。
解压缩引擎：专用解压缩引擎支持最新格式，加快数据库查询，提供数据分析和数据科学的最高性能。未来几年，在企业每年花费数百亿美元的数据处理方面，将越来越多地由 GPU 加速。

GB200 NVL72推理性能较H100提升高达30倍

英伟达同时介绍超级芯片GB200 Grace Blackwell Superchip，它通过 900GB/s的超低功耗NVLink，将两个B200 Tensor Core GPU 连接到NVIDIA Grace CPU。

为了获得最高的 AI 性能，GB200 驱动的系统可以与周一同时宣布的英伟达Quantum-X800 InfiniBand 和 Spectrum-X800 以太网平台连接，这些平台可提供速度高达 800Gb/s 的高级网络。

GB200是英伟达GB200 NVL72 的关键组件，GB200 NVL72 是一种多节点、液冷、机架规模系统，适用于计算最密集的工作负载。它结合了 36 个 Grace Blackwell 超级芯片，其中包括通过第五代 NVLink 互连的 72 个 Blackwell GPU 和 36 个 Grace CPU。GB200 NVL72 还包括 NVIDIA BlueField®-3 数据处理单元，可在超大规模 AI 云中实现云网络加速、可组合存储、零信任安全性和 GPU 计算弹性。

相比数量的H100 Tensor Core GPU 相比，GB200 NVL72 对于 LLM 推理工作负载的性能提升高达 30 倍，并将成本和能耗降低高达 25 倍。

GB200 NVL72平台充当单个 GPU具有 1.4 exaflops 的 AI 性能和 30TB 的快速内存，是最新 DGX SuperPOD 的构建块。

英伟达推出服务器主板HGX B200，它通过 NVLink 连接八个 B200 GPU，以支持基于 x86 的生成式 AI 平台。 HGX B200 通过英伟达Quantum-2 InfiniBand 和 Spectrum-X 以太网网络平台支持高达 400Gb/s 的网络速度。

亚马逊、微软、谷歌和甲骨文在首批提供Blackwell支持的云服务商之列

Blackwell芯片将成为亚马逊、微软、谷歌这类全球最大数据中心运营商部署新电脑和其他产品的基础。基于Blackwell的产品将在今年晚些时候问世。

英伟达称，亚马逊云AWS、谷歌云、微软云Azure 和甲骨文云基础设施Oracle Cloud Infrastructure将成为首批提供Blackwell支持实例的云服务提供商，英伟达云合作伙伴计划的成员公司Applied Digital、CoreWeave、Crusoe、IBM Cloud 和 Lambda 也将成为首批提供 Blackwell 实例的云服务提供商。

面向主权的Sovereign AI 云还将提供基于 Blackwell 的云服务和基础设施，包括 Indosat Ooredoo Hutchinson、Nebius、Nexgen Cloud、Oracle欧盟主权云、Oracle 美国、英国和澳大利亚政府云、Scaleway、Singtel、Northern Data Group 的 Taiga Cloud、 Yotta Data Services 的 Shakti Cloud 和 YTL Power International。

黄仁勋说，“三十年来，我们一直在追求加速计算，目标是实现深度学习和AI这类方面的变革性突破。生成式AI是我们这个时代的决定性技术。 Blackwell是推动这场新工业革命的引擎。通过与世界上最具活力的公司合作，我们将实现AI在各行各业的承诺。”

英伟达在公告通稿中列举了料将采用Blackwell的一些组织，比如微软、亚马逊、谷歌、Meta、戴尔、OpenAI、甲骨文、马斯克领导的特斯拉和 xAI。黄仁勋介绍了包括这些公司在内的更多合作伙伴。

黄仁勋还提到，台积电和Synopsys将采用英伟达计算光刻技术，起用英伟达的计算光刻平台CuLitho。

台积电和Synopsys已经整合英伟达的Culitho W软件。他们将用英伟达的下一代 Blackwell GPU 来实现AI 和 HPC 应用。

新软件NIM让用户更容易利用已有英伟达GPU进行AI推理

英伟达同时宣布推出名为英伟达NIM的推理微服务，它是优化的云原生微服务，旨在缩短生成式 AI 模型的上市时间并简化它们在云、数据中心和 GPU 加速工作站上的部署。

英伟达NIM通过使用行业标准 API 抽象化 AI 模型开发和生产包装的复杂性来扩展开发人员库。它是英伟达AI Enterprise 的一部分，为开发 AI 驱动的企业应用程序和在生产中部署 AI 模型提供了简化的路径。

NIM让用户使用旧版英伟达GPU进行推理或运行AI软件的过程变得更容易，并允许企业客户继续用他们已有的英伟达GPU。推理所需的算力比最初训练新的AI模型的少。 NIM 让企业能运行自己的AI 模型，而不是从OpenAI 等公司购买AI的成果。

基于英伟达服务器的客户只要订阅英伟达AI Enterprise 就可使用NIM，每个GPU每年的许可费用为 4500 美元。

英伟达将与微软和Hugging Face 等AI公司合作，确保他们的AI模型能够在所有兼容的英伟达芯片上运行。使用NIM的开发者可以在自己的服务器或基于云的英伟达服务器上高效地运行模型，而无需冗长的配置过程。

评论称，NIM这种软件让部署AI变得更容易，不但为英伟达创收，而且给客户提供了又一个坚持使用英伟达芯片的理由。

编辑/lambor

來源：華爾街見聞作者：李丹

英偉達稱，Blackwell的成本和能耗較前代改善25倍，是全球最強大芯片，由 2080 億個晶體管組成，採用台積電4nm製程，支持多達10萬億參數的模型進行AI訓練和實時大語言模型（LLM）推理；GB200 NVL72推理性能較H100提升高達30倍；亞馬遜、微軟、谷歌和甲骨文在首批提供Blackwell支持的雲服務商之列；台積電和Synopsys將採用英偉達計算光刻技術；英偉達推出新軟件NIM，讓用戶更容易利用已有英偉達GPU進行AI推理。

號稱今年全球頭號人工智能（AI）領域開發者大會的英偉達2024 GTC AI大會於美東時間3月18日週一拉開帷幕。

今年是英偉達時隔五年首次讓年度GTC重回線下，也是此前分析認爲英偉達要“拿出點真傢伙”的AI盛會。

當地時間週一下午，英偉達創始人兼CEO 黃仁勳在美國加州聖何塞SAP中心進行主題爲“面向開發者的1#AI峯會”（1# AI Conference for Developers）演講。

Blackwell成本和能耗較前代改善25倍全球最強大芯片台積電4 nm製程

黃仁勳介紹了運行AI模型的新一代芯片和軟件。英偉達正式推出名爲Blackwell的新一代AI圖形處理器（GPU），預計將在今年晚些時候發貨。

Blackwell平台能夠在萬億參數級的大型語言模型（LLM）上構建和運行實時生成式 AI，而成本和能耗比前代改善25倍。

英偉達稱，Blackwell擁有六項革命性的技術，可以支持多達10萬億參數的模型進行AI訓練和實時LLM推理：

全球最強大的芯片：Blackwell 架構 GPU由 2080 億個晶體管組成，採用量身定製的台積電4納米（nm）工藝製造，兩個reticle極限GPU裸片將10 TB/秒的芯片到芯片鏈路連接成單個統一的GPU 。
第二代 Transformer引擎：結合了Blackwell Tensor Core技術和TensorRT-LLM和 NeMo Megatron 框架中的英偉達先進動態範圍管理算法，Blackwell 將通過新的4位浮點AI 支持雙倍的計算和模型大小推理能力。
第五代 NVLink：爲提高數萬億參數和混合專家AI 模型的性能，最新一代英偉達NVLink爲每個 GPU 提供了突破性的 1.8TB/s 雙向吞吐量，確保最複雜LLM之間多達576 個GPU 之間的無縫高速通信。
RAS 引擎：Blackwell 支持的 GPU 包含一個專用引擎，實現可靠性、可用性和服務性。此外，Blackwell 架構還增加了芯片級功能，利用基於AI的預防性維護進行診斷和預測可靠性問題。這可以最大限度地延長系統正常運行時間，並提高大部署規模AI的彈性，使其能連續運行數週甚至數月，並降低運營成本。
安全人工智能：先進的機密計算功能可在不影響性能的情況下保護AI模型和客戶數據，並支持新的本機接口加密協議，這對於醫療保健和金融服務等隱私敏感行業至關重要。
解壓縮引擎：專用解壓縮引擎支持最新格式，加快數據庫查詢，提供數據分析和數據科學的最高性能。未來幾年，在企業每年花費數百億美元的數據處理方面，將越來越多地由 GPU 加速。

GB200 NVL72推理性能較H100提升高達30倍

英偉達同時介紹超級芯片GB200 Grace Blackwell Superchip，它通過 900GB/s的超低功耗NVLink，將兩個B200 Tensor Core GPU 連接到NVIDIA Grace CPU。

爲了獲得最高的 AI 性能，GB200 驅動的系統可以與週一同時宣佈的英偉達Quantum-X800 InfiniBand 和 Spectrum-X800 以太網平台連接，這些平台可提供速度高達 800Gb/s 的高級網絡。

GB200是英偉達GB200 NVL72 的關鍵組件，GB200 NVL72 是一種多節點、液冷、機架規模系統，適用於計算最密集的工作負載。它結合了 36 個 Grace Blackwell 超級芯片，其中包括通過第五代 NVLink 互連的 72 個 Blackwell GPU 和 36 個 Grace CPU。GB200 NVL72 還包括 NVIDIA BlueField®-3 數據處理單元，可在超大規模 AI 雲中實現雲網絡加速、可組合存儲、零信任安全性和 GPU 計算彈性。

相比數量的H100 Tensor Core GPU 相比，GB200 NVL72 對於 LLM 推理工作負載的性能提升高達 30 倍，並將成本和能耗降低高達 25 倍。

GB200 NVL72平台充當單個 GPU具有 1.4 exaflops 的 AI 性能和 30TB 的快速內存，是最新 DGX SuperPOD 的構建塊。

英偉達推出服務器主板HGX B200，它通過 NVLink 連接八個 B200 GPU，以支持基於 x86 的生成式 AI 平台。 HGX B200 通過英偉達Quantum-2 InfiniBand 和 Spectrum-X 以太網網絡平台支持高達 400Gb/s 的網絡速度。

亞馬遜、微軟、谷歌和甲骨文在首批提供Blackwell支持的雲服務商之列

Blackwell芯片將成爲亞馬遜、微軟、谷歌這類全球最大數據中心運營商部署新電腦和其他產品的基礎。基於Blackwell的產品將在今年晚些時候問世。

英偉達稱，亞馬遜雲AWS、谷歌雲、微軟雲Azure 和甲骨文雲基礎設施Oracle Cloud Infrastructure將成爲首批提供Blackwell支持實例的雲服務提供商，英偉達雲合作伙伴計劃的成員公司Applied Digital、CoreWeave、Crusoe、IBM Cloud 和 Lambda 也將成爲首批提供 Blackwell 實例的雲服務提供商。

面向主權的Sovereign AI 雲還將提供基於 Blackwell 的雲服務和基礎設施，包括 Indosat Ooredoo Hutchinson、Nebius、Nexgen Cloud、Oracle歐盟主權雲、Oracle 美國、英國和澳大利亞政府雲、Scaleway、Singtel、Northern Data Group 的 Taiga Cloud、 Yotta Data Services 的 Shakti Cloud 和 YTL Power International。

黃仁勳說，“三十年來，我們一直在追求加速計算，目標是實現深度學習和AI這類方面的變革性突破。生成式AI是我們這個時代的決定性技術。 Blackwell是推動這場新工業革命的引擎。通過與世界上最具活力的公司合作，我們將實現AI在各行各業的承諾。”

英偉達在公告通稿中列舉了料將採用Blackwell的一些組織，比如微軟、亞馬遜、谷歌、Meta、戴爾、OpenAI、甲骨文、馬斯克領導的特斯拉和 xAI。黃仁勳介紹了包括這些公司在內的更多合作伙伴。

黃仁勳還提到，台積電和Synopsys將採用英偉達計算光刻技術，起用英偉達的計算光刻平台CuLitho。

台積電和Synopsys已經整合英偉達的Culitho W軟件。他們將用英偉達的下一代 Blackwell GPU 來實現AI 和 HPC 應用。

新軟件NIM讓用戶更容易利用已有英偉達GPU進行AI推理

英偉達同時宣佈推出名爲英偉達NIM的推理微服務，它是優化的雲原生微服務，旨在縮短生成式 AI 模型的上市時間並簡化它們在雲、數據中心和 GPU 加速工作站上的部署。

英偉達NIM通過使用行業標準 API 抽象化 AI 模型開發和生產包裝的複雜性來擴展開發人員庫。它是英偉達AI Enterprise 的一部分，爲開發 AI 驅動的企業應用程序和在生產中部署 AI 模型提供了簡化的路徑。

NIM讓用戶使用舊版英偉達GPU進行推理或運行AI軟件的過程變得更容易，並允許企業客戶繼續用他們已有的英偉達GPU。推理所需的算力比最初訓練新的AI模型的少。 NIM 讓企業能運行自己的AI 模型，而不是從OpenAI 等公司購買AI的成果。

基於英偉達服務器的客戶只要訂閱英偉達AI Enterprise 就可使用NIM，每個GPU每年的許可費用爲 4500 美元。

英偉達將與微軟和Hugging Face 等AI公司合作，確保他們的AI模型能夠在所有兼容的英偉達芯片上運行。使用NIM的開發者可以在自己的服務器或基於雲的英偉達服務器上高效地運行模型，而無需冗長的配置過程。

評論稱，NIM這種軟件讓部署AI變得更容易，不但爲英偉達創收，而且給客戶提供了又一個堅持使用英偉達芯片的理由。

編輯/lambor

譯文內容由第三人軟體翻譯。

以上內容僅用作資訊或教育之目的，不構成與富途相關的任何投資建議。富途竭力但無法保證上述全部內容的真實性、準確性和原創性。