share_log

马斯克启动“全球最强大AI训练集群” 背后隐藏内忧外患

馬斯克啓動“全球最強大AI訓練集群” 背後隱藏內憂外患

財聯社 ·  07/24 10:27

①馬斯克在其X上宣佈當地時間7月22日凌晨4時20分開始xAI在孟菲斯超級集群上(Memphis Supercluster)進行訓練。②科技巨頭也都在擴建數據中心來訓練和運行他們的人工智能模型,馬斯克“最強大的超級集群”難以持續。

《科創板日報》7月24日訊(記者 張洋洋 特約記者 陳俊清)馬斯克在其X社交平台上宣佈,xAI團隊、X團隊、$英偉達 (NVDA.US)$及支持公司於當地時間7月22日凌晨4時20分開始在孟菲斯超級集群上(Memphis Supercluster)進行訓練。

據馬斯克介紹稱,該集群在單個RDMA fabric上使用10萬張液冷H100,是“世界上最強大的AI訓練集群”。其目標是在今年12月前訓練出“按每項指標衡量都是世界上最強大的人工智能。”

馬斯克此前曾表示,xAI計劃於8月發佈Grok 2,但目前並未宣稱利用新的超級計算集群訓練Grok 2。不過,確定的是計劃於2024年底發佈的Gork 3將在孟菲斯超級訓練集群進行訓練。本月早些時候,馬斯克在X的一篇文章中指出,xAI的Grok 3將在100,000個 H100 GPU上進行訓練,因此“它應該非常特別”。

從規模上看,新的xAI孟菲斯超級集群確實在GPU算力方面超越了最新Top500榜單上的任何一臺超級計算機。如Frontier(37,888 個 AMD GPU)、Aurora(60,000個Intel GPU)和Microsoft Eagle(14,400個Nvidia H100 GPU),似乎都遠遠落後於xAI機器。

儘管規模龐大,但“世界上最強大的AI訓練集群”的名頭難以長期保持。

目前,$微軟 (MSFT.US)$$谷歌-C (GOOG.US)$/$谷歌-A (GOOGL.US)$$Meta Platforms (META.US)$等其他科技巨頭也都在擴建數據中心來訓練和運行他們的人工智能模型。路透社曾報道稱,微軟和OpenAI正在計劃建設一個數據中心項目,該項目將包含一個擁有數百萬專用服務器芯片的超級計算機,而目前項目耗資可能1150億美元,包括一個名爲 Stargate(「星際之門」)的人工智能超級計算機,預計將於2028年啓動。

Meta首席執行官扎克伯格也在今年一月份表示,到2024年底,公司的計算基礎設施將包括3萬張H100顯卡。他還補充道,“如果包括其他GPU,則大約有60萬台H100等效計算。”

此外,除了算力競爭激烈的外患以外,xAI建設算力中心的內憂也一直存在。

據孟菲斯當地媒體報道,xAI將在佔地785,000平方英尺的前伊萊克斯孟菲斯工廠建造一個超級計算機集群,“將是該市歷史上一家新進入市場的公司最大的資本投資。”

負責這筆交易的經濟增長非營利組織大孟菲斯商會會長泰德·湯森稱,經過3月份幾天的激烈談判,馬斯克和他的團隊(其中包括來自他幾家公司的代表)選擇了田納西州的孟菲斯市,因爲這裏電力充足,而且建設速度快。

然而,xAI還沒有與當地公用事業公司田納西河谷管理局(Tennessee Valley Authority)簽訂合同,“TVA 尚未與xAI簽訂合同。我們正在與xAI和MLGW的合作伙伴就提案和電力需求的細節進行合作。”TVA還指出,任何超過100兆瓦的項目接入電力系統都需要TVA批准。

儘管大孟菲斯商會團體讚揚xAI在該地區開設設施的決定,但一些當地人對該設施的能源和水消耗表示擔憂。孟菲斯社區反污染組織和其他兩個環保組織警告說,計算機設施會造成嚴重的“能源負擔”。他們表示,“xAI預計每天至少需要一百萬加侖的水用於其冷卻塔。”

孟菲斯市議會的幾名成員正敦促政府停止馬斯克算力工廠在孟菲斯建設,因爲社區對這筆交易的祕密性質以及數據中心對電力和水的要求越來越擔憂。

編輯/jayden

譯文內容由第三人軟體翻譯。


以上內容僅用作資訊或教育之目的,不構成與富途相關的任何投資建議。富途竭力但無法保證上述全部內容的真實性、準確性和原創性。
    搶先評論