聚焦科技股

專題 2307條資訊 31121人訂閱

英偉達曝AI專用「核彈」：GPT速度提高30倍，三大雲廠商搶着買

極客公園 · 2023/03/22 07:39

来源：极客公园
作者：郑玄

3 月21 日晚上11 点，英伟达CEO黄仁勋的演讲，为 GTC 2023 拉开序幕。

ChatGPT 和 GPT-4 掀起这股生成式 AI 热潮后，为 AI 提供心脏的英伟达成了背后的大赢家，也让今年的 GTC 注定成为有史以来最受关注的一届。

黄仁勋没有让关注者失望。

「AI 的 iPhone 时刻已经到来。」70 分钟的演讲里，老黄重复了四五遍。

每次讲这句话前，他都会分享一项关于生成式 AI 的新进展——对创作、医疗、工业等领域的革命，让普通人用浏览器就能训练大模型的云服务，以及让大模型处理成本下降 10 倍的超级芯片……

「AI 的发展会超过任何人的想象。」这句话是对这场演讲最好的注脚。

01 让大语言模型的处理成本下降一个数量级

2012 年，Alex Kerchevsky、Ilya Suskever 和他们的导师 Geoff Hinton 在两块 GeForce GTX 580 上，使用 1400 万张图像训练了 AlexNet——这被认为是这一轮 AI 革命的开端，因为它首次证明了 GPU 可以用于训练人工智能。

4 年后，黄仁勋亲手向 OpenAI 交付了第一台 NVIDIA DGX 超级计算机。此后数年，OpenAI 在大型语言模型上的突破让 AIGC 开始进入人们的视野，并在去年年底推出 ChatGPT 后彻底破圈。几个月内这个对话式 AI 产品吸引了超过 1 亿用户，成为历史上增长最快的 App。

NVIDIA DGX 最初被用作 AI 的研究设备，现在已经被企业广泛用于优化数据和处理 AI。根据黄仁勋，财富 100 强公司中有一半安装了 DGX。

在这之中，部署像 ChatGPT 这样的 LLM 正在成为 DGX 越来越重要的一项工作。对此，黄仁勋宣布了一种新的 GPU——带有双图形处理器 NVLink 的 H100 NVL。

基于英伟达的 Hopper 架构，H100 采用 Transformer 引擎，被设计用于专门处理类似 GPT 这样的模型。与用于 GPT-3 处理的 HGX A100 相比，一个搭载四对 H100 和 NVLINK 的标准服务器的处理速度快 10 倍。根据官网数据，H100 的综合技术创新。可以将大型语言模型的速度提高 30 倍。

「H100 可以将大型语言模型处理成本降低一个数量级，」黄仁勋说到。

此外，在过去的十年里，云计算每年增长 20%，成为一个 1 万亿美元的行业。为了 AI 和云计算，英伟达设计了 Grace CPU，在新的架构下，GPU 负责处理 AI 的工作负载，Grace CPU 负责采样，二者之间通过一个 900 GB/s 的高速传输设备连接在一起。

「Grace-Hopper 是处理大规模数据集的最佳选择。」黄仁勋称，「我们的客户希望建立训练数据大几个数量级的 AI 大模型，Grace-Hopper 是理想的引擎。」

某种意义上来说，计算成本已经成为今天阻碍生成式 AI 发展的核心问题，OpenAI 为此烧掉了数十亿乃至上百亿美元，微软也出于成本考虑始终没有向更大范围的公众开放新 Bing，甚至限制用户每天的对话次数。

英伟达此时推出更高效的算力方案，无疑是给行业解决了一个大难题。

02 DGX Cloud：让任何企业都能构建 AI 能力

今年 GTC 上另一个涉及生成式 AI 的重点，就是 DGX Cloud。

实际上，这并不是英伟达第一次公布 DGX Cloud。此前英伟达四季报发布时，黄仁勋就向外界透露英伟达将与云服务厂商展开合作，让客户可以使用网页浏览器，就能通过 NVIDIA DGX Cloud 来使用 DGX 计算机，从而训练和部署大型语言模型或完成其他 AI 工作负载。

英伟达已经与甲骨文展开合作，预计下个季度微软 Azure 也会开始托管 DGX 云，而谷歌云也将在不久之后加入这一行列，以托管的方式向那些有意愿构建新产品和发展 AI 战略的企业提供 DGX 云服务。

黄仁勋称，这种合作关系将英伟达的生态系统带到了云服务商手中，同时扩大了英伟达的市场规模和覆盖面。企业将能够每月租用 DGX 云集群，确保他们能够快速轻松地扩展大型多节点 AI 训练。

03 ChatGPT 只是开始

「加速计算是曲速引擎，AI 就是它的能源。」黄仁勋说道，「生成式 AI 日新月异的能力，给我们重新构想其产品和商业模式带来了紧迫感。」

ChatGPT 和 GPT-4 为代表的大语言模型在过去几个月火遍全球，但对英伟达来说，ChatGPT 和大模型并不是 AI 的全部。会上，黄仁勋还分享了更多英伟达在 AI 领域的探索和他本人的观察。

首先是最火的生成式 AI。

只需要一张手绘的草图，就能生成 3D 建模的户型。

撰写代码也不在话下。

还有创作音乐。

为了加速那些寻求利用生成 AI 的人的工作，英伟达宣布成立 NVIDIA AI Foundations，这是一个云服务和代工厂，面向需要构建、改进和定制 LLM 和生成式 AI 的用户，这些客户使用其专有数据训练特定领域的 AI。

AI Foundations 的服务包括 NVIDIA NeMo，用于构建文本-文本的生成模型；毕加索，一种视觉语言模型制作服务，面向希望构建基于经授权内容训练模型的用户；以及 BioNeMo，帮助生物医药研究人员。

作为生产力工具，AI 也在发挥巨大的价值，黄仁勋在演讲中介绍了几个非常有意思的案例。

第一个是与美国电信巨头 AT&T。AT&T 需要定期派遣 3 万名技术人员，为 700 个区域的 1300 万名客户提供服务。这个庞大的数据，调度是一个痛点，如果在 CPU 上运行，调度优化需要一整夜的时间才能完成。

借助英伟达的 CuOpt，AT&T 可以将调度方案的优化时间加快 100 倍，并可实时更新其调度方案。

某种意义上，在英伟达的帮助下，AT&T 做到了美团、滴滴这些需要实时匹配的互联网公司用好多年积累才做到的事情。

另一个案例是与芯片公司的合作。随着中美科技战，大多数人都知道了光刻机这个半导体产业的关键设备。但鲜为人知的是，随着制程技术的发展，芯片设计对算力的需求也是半导体行业的一大痛点。

今天计算光刻是芯片设计和制造领域最大的计算工作负载，每年需要消耗数百亿 CPU 小时，并且随着算法越来越复杂，计算光刻的成本也在提高。

对此，英伟达宣布推出 cuLitho——一个计算光刻库。并与 ASML、台积电等巨头展开合作，从而大幅降低芯片设计过程中的算力消耗，节能减排。

事实上，减少能源消耗，提高计算效率，是黄仁勋眼中 AI 技术将为人类社会带来的另一大价值。而在摩尔定律失效的当下，加速计算和 AI 的到来恰逢其时。

「各行业正都在面对可持续发展、生成式 AI 和数字化的挑战。工业公司正在竞相数字化，并重塑为软件驱动的科技公司——成为颠覆者，而不是被颠覆者，」加速计算让这些公司可以应对这些挑战，黄仁勋说道。「加速计算是减少电力消耗、实现可持续性发展和碳中和的最佳方式。」

编辑/jayden

來源：極客公園
作者：鄭玄

3 月21 日晚上11 點，英偉達CEO黃仁勳的演講，爲 GTC 2023 拉開序幕。

ChatGPT 和 GPT-4 掀起這股生成式 AI 熱潮後，爲 AI 提供心臟的英偉達成了背後的大贏家，也讓今年的 GTC 註定成爲有史以來最受關注的一屆。

黃仁勳沒有讓關注者失望。

「AI 的 iPhone 時刻已經到來。」70 分鐘的演講裏，老黃重複了四五遍。

每次講這句話前，他都會分享一項關於生成式 AI 的新進展——對創作、醫療、工業等領域的革命，讓普通人用瀏覽器就能訓練大模型的雲服務，以及讓大模型處理成本下降 10 倍的超級芯片……

「AI 的發展會超過任何人的想象。」這句話是對這場演講最好的註腳。

01 讓大語言模型的處理成本下降一個數量級

2012 年，Alex Kerchevsky、Ilya Suskever 和他們的導師 Geoff Hinton 在兩塊 GeForce GTX 580 上，使用 1400 萬張圖像訓練了 AlexNet——這被認爲是這一輪 AI 革命的開端，因爲它首次證明了 GPU 可以用於訓練人工智能。

4 年後，黃仁勳親手向 OpenAI 交付了第一臺 NVIDIA DGX 超級計算機。此後數年，OpenAI 在大型語言模型上的突破讓 AIGC 開始進入人們的視野，並在去年年底推出 ChatGPT 後徹底破圈。幾個月內這個對話式 AI 產品吸引了超過 1 億用戶，成爲歷史上增長最快的 App。

NVIDIA DGX 最初被用作 AI 的研究設備，現在已經被企業廣泛用於優化數據和處理 AI。根據黃仁勳，財富 100 強公司中有一半安裝了 DGX。

在這之中，部署像 ChatGPT 這樣的 LLM 正在成爲 DGX 越來越重要的一項工作。對此，黃仁勳宣佈了一種新的 GPU——帶有雙圖形處理器 NVLink 的 H100 NVL。

基於英偉達的 Hopper 架構，H100 採用 Transformer 引擎，被設計用於專門處理類似 GPT 這樣的模型。與用於 GPT-3 處理的 HGX A100 相比，一個搭載四對 H100 和 NVLINK 的標準服務器的處理速度快 10 倍。根據官網數據，H100 的綜合技術創新。可以將大型語言模型的速度提高 30 倍。

「H100 可以將大型語言模型處理成本降低一個數量級，」黃仁勳說到。

此外，在過去的十年裏，雲計算每年增長 20%，成爲一個 1 萬億美元的行業。爲了 AI 和雲計算，英偉達設計了 Grace CPU，在新的架構下，GPU 負責處理 AI 的工作負載，Grace CPU 負責採樣，二者之間通過一個 900 GB/s 的高速傳輸設備連接在一起。

「Grace-Hopper 是處理大規模數據集的最佳選擇。」黃仁勳稱，「我們的客戶希望建立訓練數據大幾個數量級的 AI 大模型，Grace-Hopper 是理想的引擎。」

某種意義上來說，計算成本已經成爲今天阻礙生成式 AI 發展的核心問題，OpenAI 爲此燒掉了數十億乃至上百億美元，微軟也出於成本考慮始終沒有向更大範圍的公衆開放新 Bing，甚至限制用戶每天的對話次數。

英偉達此時推出更高效的算力方案，無疑是給行業解決了一個大難題。

02 DGX Cloud：讓任何企業都能構建 AI 能力

今年 GTC 上另一個涉及生成式 AI 的重點，就是 DGX Cloud。

實際上，這並不是英偉達第一次公佈 DGX Cloud。此前英偉達四季報發佈時，黃仁勳就向外界透露英偉達將與雲服務廠商展開合作，讓客戶可以使用網頁瀏覽器，就能通過 NVIDIA DGX Cloud 來使用 DGX 計算機，從而訓練和部署大型語言模型或完成其他 AI 工作負載。

英偉達已經與甲骨文展開合作，預計下個季度微軟 Azure 也會開始託管 DGX 雲，而谷歌雲也將在不久之後加入這一行列，以託管的方式向那些有意願構建新產品和發展 AI 戰略的企業提供 DGX 雲服務。

黃仁勳稱，這種合作關係將英偉達的生態系統帶到了雲服務商手中，同時擴大了英偉達的市場規模和覆蓋面。企業將能夠每月租用 DGX 雲集羣，確保他們能夠快速輕鬆地擴展大型多節點 AI 訓練。

03 ChatGPT 只是開始

「加速計算是曲速引擎，AI 就是它的能源。」黃仁勳說道，「生成式 AI 日新月異的能力，給我們重新構想其產品和商業模式帶來了緊迫感。」

ChatGPT 和 GPT-4 爲代表的大語言模型在過去幾個月火遍全球，但對英偉達來說，ChatGPT 和大模型並不是 AI 的全部。會上，黃仁勳還分享了更多英偉達在 AI 領域的探索和他本人的觀察。

首先是最火的生成式 AI。

只需要一張手繪的草圖，就能生成 3D 建模的戶型。

撰寫代碼也不在話下。

還有創作音樂。

爲了加速那些尋求利用生成 AI 的人的工作，英偉達宣佈成立 NVIDIA AI Foundations，這是一個雲服務和代工廠，面向需要構建、改進和定製 LLM 和生成式 AI 的用戶，這些客戶使用其專有數據訓練特定領域的 AI。

AI Foundations 的服務包括 NVIDIA NeMo，用於構建文本-文本的生成模型；畢加索，一種視覺語言模型製作服務，面向希望構建基於經授權內容訓練模型的用戶；以及 BioNeMo，幫助生物醫藥研究人員。

作爲生產力工具，AI 也在發揮巨大的價值，黃仁勳在演講中介紹了幾個非常有意思的案例。

第一個是與美國電信巨頭 AT&T。AT&T 需要定期派遣 3 萬名技術人員，爲 700 個區域的 1300 萬名客戶提供服務。這個龐大的數據，調度是一個痛點，如果在 CPU 上運行，調度優化需要一整夜的時間才能完成。

藉助英偉達的 CuOpt，AT&T 可以將調度方案的優化時間加快 100 倍，並可實時更新其調度方案。

某種意義上，在英偉達的幫助下，AT&T 做到了美團、滴滴這些需要實時匹配的互聯網公司用好多年積累才做到的事情。

另一個案例是與芯片公司的合作。隨着中美科技戰，大多數人都知道了光刻機這個半導體產業的關鍵設備。但鮮爲人知的是，隨着製程技術的發展，芯片設計對算力的需求也是半導體行業的一大痛點。

今天計算光刻是芯片設計和製造領域最大的計算工作負載，每年需要消耗數百億 CPU 小時，並且隨着算法越來越複雜，計算光刻的成本也在提高。

對此，英偉達宣佈推出 cuLitho——一個計算光刻庫。並與 ASML、臺積電等巨頭展開合作，從而大幅降低芯片設計過程中的算力消耗，節能減排。

事實上，減少能源消耗，提高計算效率，是黃仁勳眼中 AI 技術將爲人類社會帶來的另一大價值。而在摩爾定律失效的當下，加速計算和 AI 的到來恰逢其時。

「各行業正都在面對可持續發展、生成式 AI 和數字化的挑戰。工業公司正在競相數字化，並重塑爲軟件驅動的科技公司——成爲顛覆者，而不是被顛覆者，」加速計算讓這些公司可以應對這些挑戰，黃仁勳說道。「加速計算是減少電力消耗、實現可持續性發展和碳中和的最佳方式。」

編輯/jayden

譯文內容由第三人軟體翻譯。

以上內容僅用作資訊或教育之目的，不構成與富途相關的任何投資建議。富途竭力但無法保證上述全部內容的真實性、準確性和原創性。