share_log

趋势洞察 | AI的尽头真的是光伏、储能和核能吗?— GTC归来,对AIDC的设计与建设思考(一)

趨勢洞察 | AI的盡頭真的是光伏、儲能和核能嗎?— GTC歸來,對AIDC的設計與建設思考(一)

萬國數據 ·  04/10 12:00

以下文章來源於GDS PiloTalk ,作者剛爺

引言

“AI的盡頭是能源”,觀點一出,引發科技界熱議,即便是在英偉達Blackwell架構單GPU性能在提高5倍,能耗下降25倍的“極致”能效表現下。

對於數據中心企業而言,如何降低能耗、提高能效是一個永恒的話題,未來AIDC的更大範圍部署勢必將繼續延續全社會對這一話題的關注。

當然,在數據中心領域,需要思考的“盡頭”絕不只有能源,而所謂的極限,往往取決於我們現有認知和技術水平的邊界,但,也可能是沒有邊界的。所以在這裏,我們希望結合AIDC的發展趨勢,針對現有的一些極限,談一談自己的思考。

1、AI芯片密度狂飆,服務器的極限在哪裏?

NVIDIA最新發布的NVL72,單機櫃用電功率最大爲120kW, 採用冷板液冷的解決方案。這120kW單櫃功率中仍然存在15%左右比例約20kW的風冷散熱需求,也已經接近房間級空調風冷散熱能力的上限。根據此次GTC會議現場的了解,在GPU芯片功率密度進一步提升的條件下,下一步散熱方案將考慮浸沒+冷板液冷同時散熱解決方案,單機櫃功率在未來2~3年預計可達到300kW每臺

事實上,仔細揣摩NVL72的架構,作爲一種全新的產品,它的震撼點在於NVL72架構已經不再以傳統的芯片-服務器-網絡架構理念的簡單重複堆疊,而是通過顛覆性架構解構和重組的暴力美學方式,根據最基本的物理學原理選擇最合適的技術方案,驅動着GPU的指數級演進。芯片密度的急劇提升,導致液冷散熱的充分必要結果,而冷板液冷散熱的高效又使得現有經典網絡架構中不再使用的銅纜取代光模塊及光纜重回歷史舞臺,由此誕生了一種新的物種。這就是經典的“量變引起質變”的案例,也是底層技術迭代後,配套傳統技術方案遭受降維打擊的典型代表。

也許,多年以後,決定單臺GPU功率上限將不再是芯片散熱能力的上限,而是配電系統PDU、UPS或變壓器的容量上限。單個AIDC園區的容量上限不是芯片算力的上限,而是發電廠和電網容量的上限

2、如今數據中心從單個機房、單體建築和園區維度,多大顆粒度是最合適的?

考慮到以往數據中心需求都是兆瓦或者10兆瓦級,單次交付和總體需求規模較小。因此,在DC園區和單體規劃時,更多是基於基礎設施如建築規劃要求、消防法規要求、電網容量(10kV/110kV/220kV)和MEP設施如柴發、冷機、空調等設備的冗餘與成本最佳配比關係等來主導決定顆粒度。 如今AIGC井噴式業務的發展,本質上是DC容量的需求呈指數級增長,匹配最佳的DC或園區容量需求時,規劃限制則轉變爲網絡架構上限容量和芯片密度的上限主導。

如今行業內主流的雲廠商或互聯網企業,在當前流行的架構下,單園區的規模可以達到100~200MW, 未來隨着芯片密度的不斷提升,未來甚至會達300~500MW以上。在這樣的背景,及電力和土地條件匹配的情況下,數據中心基礎設施資源規劃時,應該學習英偉達做GPU的理念,從design a data center as a Computer到 design a data center as a GPU。如果一臺Giant GPU 理想容量是100MW,那就基礎設施的容量而言,最佳的顆粒度也就是100MW。然而,芯片技術的發展日新月異,NVIDIA 的GPU芯片效率8年增長了1000倍,而數據中心的投資建設和回報週期就是10~15年,基於當下的芯片技術預測單體數據中心體量,匹配一個完美的極致數據中心規劃的想法是不現實也不科學的。

我們可能需要換一個思路,從基礎設施效率最佳的維度,合理、可行、成本儘量低爲終極目標,從技術手段上克服建築消防規劃限制、CAPEX初投資比例及後續持續分期建設等挑戰,做出一個可以適配未來業務需求變化的IDC一體化產品模型,這才是數據中心從業人員需要去解決的實際問題,也是IDC企業建立自身產品核心競爭力的關鍵要素。

3、AI的盡頭是光伏、儲能和核能的說法合理嗎?

這應該是行業最近最火的話題之一,AI的盡頭是光伏、儲能、核能,也是變壓器、銅、電纜等各種跟能源相關的期貨,本質上是業務需求的高速增長帶來的能源需求激增。

選址 —— 從靠近負荷中心向靠近綜合能源中心轉變

當園區規模達到200MW以上時,從供電角度至少需要220kV站配置才能滿足要求,而當園區體量超過500MW以上時,一座220kV站也無法滿足要求。在這種規模體量的數據中心集群的條件下,現有電網的容量受到限制,數據中心的選址必須進一步靠近具有充足電量的能源中心才能成立。與之形成的矛盾是,大體量的能源中心一次性投入較大,如果數據中心的業務需求無法在短時間內匹配,將會產生巨大的初投資沉沒成本。

因此,爲了更好地解決這樣的問題,一個與數據中心基礎設施需求配套的區域型綜合能源管理系統需求就應運而生。通過源網荷儲技術的應用,使得局部區域內的各類能源能夠有效的利用,保證經濟性。此外,通過能源系統的足量供應保證及長週期穩定OPEX保證,相比相對容易落地的土建和MEP系統而言,也能夠爲數據中心基礎設施的資產投資的確定性帶來更多的附加價值。

Onsite —— 光儲備一體

單純的風能、光伏、儲能技術,無論是onsite還是offsite,與數據中心本身沒有太大的關係,能不能用,好不好用,完全取決於技術和產業的成熟度和適用場景。至少在當前的市場和技術條件下,光伏和儲能的應用與項目所處的位置強相關、及其電源不穩定的特性,難以作爲AIDC單一通用電源的解決方案,必須要與其他的穩定能源解決方案結合使用。 Onsite的光伏和儲能技術則由於受限於空間限制,規模也很難做大,但由於其根據時間變化提供額外能源的能力、與數據中心用電負荷隨氣候變化的條件匹配,可以與數據中心的基礎架構融合起來,嘗試提高數據中心的IT和外電轉化率,替代一部分UPS備電設備,發揮額外的經濟收益,甚至遠大於常規光伏和儲能技術本身帶來的經濟收益。

未來 —— 核能技術應用的前景

筆者作爲一名曾經在覈電行業工作過多年的IDC從業人員,未曾想到這兩個行業可以結合在一起成爲今天的一個熱門話題。這兩年,微軟和AWS在覈電行業的動向也引發了諸多同行的熱議。今天再看看核電和數據中心,從能源側和負荷側而言,有許多共同點,也是蠻精妙的。一是穩定的輸入和輸出,二是在安全冗餘的設置上邏輯相似。

中國核電技術經過多年的發展,已經自主開發完成了具備自主知識產權的華龍一號和國和一號先進三代核電技術,在世界上也處於領先地位。由於中國核電供應鏈體系的完整性,國產化比例已經高達90%以上,核電單kW造價已經達到15000 RMB/kW,只有海外同類堆型成本的20%不到,折算到上網電價成本現今也不過0.4元。同時要知道核電站的設計壽命爲40~60年,相比壽命只有10~20年的光伏或者風電系統,無論從電源的穩定性和綜合投入成本來看,相信隨着核電技術的持續迭代會具備更強的競爭力。從技術成熟度而言,中國自主開發的核電小堆玲瓏一號ACP100已經具備商業化的條件,小型模塊化反應堆SMR 100~300MW的體量,從容量上也十分匹配AIDC園區的體量。

然而,要想進一步實質上解決核能與數據中心融合的問題,筆者初步有以下思考予以分享:

快速交付匹配:先進的三代和四代核電技術本身十分成熟,其安全性完全沒有必要擔心。然而,現在世界核安全監管體系仍然十分繁雜,項目的規劃開發建設週期長達8~10年以上,這與AIDC快速部署的特點存在一定矛盾。當前國際和國內小型模塊化核電堆型容量多爲100MWe左右,雖然比傳統百萬千瓦級核電站已經有技術優化,但整個核電站的基本架構體系還是基於傳統的核電站架構來展開,有點類似於縮小版的大型核電站。因此,相關的監管體系、標準體系均難以跳脫原有行業標準,從而在開發週期匹配上存在問題。試想,又回到開頭NVL72的那個原理, 如果我們可以在覈電堆型容量20MWe~100MWe上找到一個平衡,在突破核電系統傳統技術架構的基礎上,最大化簡化安全系統的設計,開發出一種具備快速交付能力的非能動小堆或微堆。雖然從體量上而言更小,成本可能更高,但快速複製的能力更強,和AIDC的匹配度會更高。事實上現在的大堆就是在以前小堆的基礎上開發出來的,因此原型堆裏應該有不少成熟方案可以回頭看看,說不定能變廢爲寶。

通用性匹配:當前核電技術標準體系非常完善,本質上從設備製造、設計建設的管理體系方面與傳統民用項目存在諸多差異,這些差異也形成了相關的行業壁壘和成本溢價。爲了使得核電的建設速度和成本更加具備競爭力,在採用更小容量的小堆型號時,我們需要更好地利用當前市場上通用的商品級物料進行替代,在保障安全的同時提高產品通用率,避免行業壁壘帶來的成本溢價。

選址條件匹配:核電站的選址要求遠高於數據中心,一個合格的核電廠址是非常稀缺的資源。好處是,核電站可以選擇不受氣候條件的干擾,最新的技術也不一定要靠海或靠河來解決散熱問題。只要數據中心本身選址所需要的網絡、時延問題可以匹配,也就不會有太大的問題。

One more thing:核電站作爲發電廠,運行時也產生大量的餘熱資源,通過冷熱電三聯供,可以在提高能源轉換效率和算力轉換效率上取得雙贏的局面,PUE可能也不再會是問題。

結語 

以上,我們結合2024GTC上發佈的重磅產品,從主旨演講及交流中得到的信息,以及筆者多年在數據中心和核能領域的持續深耕經驗,淺析了AI GPU和AIDC的極限、終點和未來。在下半部分,我們將圍繞一個關鍵詞——變與不變,繼續探討AIDC基礎設施的未來趨勢。

譯文內容由第三人軟體翻譯。


以上內容僅用作資訊或教育之目的,不構成與富途相關的任何投資建議。富途竭力但無法保證上述全部內容的真實性、準確性和原創性。
    搶先評論