share_log

单节点算力飙至5 PFLOPS!NVIDIA最新AI超级计算机开启测试

單節點算力飆至5 PFLOPS!NVIDIA最新AI超級計算機開啓測試

智东西 ·  2020/10/20 11:08

原標題:單節點算力飆至5 PFLOPS!NVIDIA最新AI超級計算機開啟測試 來源:智東西

481a-kavypmp5439786.jpg

文 | 温淑

老牌金融玩家平安保險集團旗下的平安科技集團,曾在短短一個月時間內搭建了企業辦公場景AI翻譯產品“平安好譯”的模型。

與傳統解決方案相比,“平安好譯”的數據處理速度較原來提升了 7 倍,翻譯1000個英文字符的平均翻譯時間從8.3s降低到0.97s。

1c03-kavypmp5439787.png

在“平安好譯”實現的效率提升背後,是NVIDIA DGX家族第一代AI超級計算機DGX-1提供的超強AI性能。最近,NVIDIA明星產品DGX家族再添新成員。

今年5月舉辦的GTC 2020大會上,全球AI計算領導者NVIDIA發佈全球最先進AI系統NVIDIA DGX A100。同時,NVIDIA DGX A100即將開放產品測試申請。

AI計算正當風勁揚帆時,千行百業智能化變革在即,有消費互聯網基因的IT等產業立在“潮頭”,對比之下,醫療、傳統工業等智能化能力欠缺的產業轉型,無疑面臨着更大的挑戰。

全球AI計算領跑者英偉達(NVIDIA),正通過DGX家族產品,提供一種幫助企業“降本增效”的AI解決方案。

在NVIDIA DGX A100即將開放產品測試申請之際,今天,智東西與你一起,解讀NVIDIA DGX家族為哪些產業帶來變化、揭祕NVIDIA DGX A100背後的軟硬件“黑科技”。

一、NVIDIA DGX家族產品為AI計算降本增效

病毒基因組測序、感染分析和預測……在生物醫藥的每個細分領域,如何處理龐雜的醫學數據、模擬複雜的感染過程都是一大難題。在藥物研發的重要性從未被如此重視的2020年,NVIDIA的DGX SuperPOD正為新冠病毒藥物的研發提供助力。

生物醫藥公司葛蘭素史克、阿斯利康將首批使用全球排名第29位的超級計算機Cambridge-1,解決包括新冠病毒在內的醫學難題。而超級計算機Cambridge-1,搭載的正是NVIDIA最新推出的NVIDIA DGX SuperPOD解決方案。

NVIDIA DGX SuperPOD是由20~140個NVIDIA DGX A100系統構建的全球首個一站式AI基礎設施。

模塊化的DGX SuperPOD架構可用短短數週,完成安裝並運行傳統超級計算機需要數年時間才能部署的系統

▲Cambridge-1超級計算機

其實,這已不是NVIDIA DGX家族產品首次憑藉其亮眼性能為產業帶來效率的提升。

比如,本次開放產品測試的DGX A100首批系統,已經交付給美國阿貢國家實驗室,用於加速新冠病毒藥物研究。其前代AI超級計算機產品DGX-1及DGX-2,也已經落地於許多行業。

針對數字化基礎貧弱的傳統紡織行業中,織物瑕疵檢測的問題,中原工學院(原鄭州紡織工學院)基於NVIDIA DGX-1超級計算機訓練AI模型。NVIDIA DGX-1集成了8個NVIDIA V100 GPU,而單張V100每秒平均訓練的圖片的效率,可達雙路CPU服務器的30倍以上

另外,在推動科研院所先進科技成果加速落地的過程中,也有NVIDIA DGX家族的身影。對於科研院所來説,科研人員IT能力的欠缺,是導致先進成果難以落地的一大原因。

針對這一現狀,上海交通大學網絡信息中心計算部基於NVIDIA DGX-2超級計算機打造AI計算平臺,該AI計算平臺峯值算力達16 PFLOPS。

截至,上海交大AI計算平臺為上海交大人工智能研究院、Bio-X研究院、密西根聯合學院等多院系的研究團隊優化AI計算及HPC應用,最高將科研效率提升1.8萬倍

▲NVIDIA DGX A100系統

在效率提升的基礎上,NVIDIA DGX家族產品在降低成本方面亦有優勢。

一個典型的AI數據中心有50個DGX-1系統用於AI訓練,600個CPU系統用於AI推理,需用25個機架,功率為630kW,成本逾1100萬美元。在這之外,模型訓練、推理的時間、資金、人才成本還需另行計算。

相比之下,由5個DGX A100系統組成的機架可達到同樣的動作效果,並且功率僅為28kW、成本低至100萬美元。

不同於在消費互聯網時代積累了大量軟硬件基礎以及數字化經驗的科技企業,生物醫藥、輕重工業等較為傳統的企業、乃至缺乏IT經驗的科研院所,在AI技術浪潮中面臨的挑戰,下至基本的軟硬件配置、上至數字化人才的配備。

NVIDIA在2017推出面向深度學習平臺構建任務的AI超級計算機DGX-1、在2018年推出面向AI速度和規模挑戰的超級計算機DGX-2,正是針對行業智能化轉型的困境提出解決方案。

NVIDIA DGX A100已經是NVIDIA DGX家族的第三代AI超級計算機產品,亦是本次NVIDIA產品測試申請計劃的“主角”。

二、DGX A100:面向所有AI工作負載,算力媲美數據中心

距離DGX-1推出三年時間,在今年5月14日舉辦的GTC 2020大會上,NVIDIA推出面向所有AI工作負載的全球AI基礎架構通用系統DGX A100,為客户提供5 petaFLOPS AI性能的超強算力,並擁有“開箱”即用的快速部署能力。

1、媲美數據中心的超強算力

NVIDIA DGX A100系統將訓練、推理、數據分析統一於一個平臺,是世界上第一臺單節點AI算力達到5 petaFLOPS的服務器

5個NVIDIA DGX A100系統組成的機架,算力可媲美一個由50個DGX-1系統、600個CPU系統組成的AI數據中心。

▲NVIDIA DGX A100系統與傳統的AI數據中心參數比較

2開箱即用的快速部署能力

NVIDIA DGX系統不僅能滿足企業的數據處理和智能化部署需求,而且降低智能化“門檻”,致力於提供“開箱即用”的便捷體驗。

以美國阿貢國家實驗室(Argonne Nationl Laboratory)基於NVIDIA DGX SuperPOD構建的Selene系統為例。Selene是全球運算速度排名第七的計算機,可用於研究遏制新冠病毒的方法,還推動着AI在汽車、醫療保健和自然語言處理領域的發展。

令人意外的是,基於NVIDIA與客户共享的開放式架構,組裝Selene這樣一個大型AI系統僅由一個小團隊花費不到一個月的時間完成

相比之下,要基於其他解決方案構建這樣一個大型AI系統,在最理想的情況下也需要數十名工程師花費幾個月的時間。

三、強大的企業級AI解決方案:從硬到軟的全面技術支撐,即將開啟測試申請

在NVIDIA DGX A100以及NVIDIA DGX SuperPOD解決方案提供的強大AI解決方案背後,是NVIDIA在NVIDIA DGX A100產品中提供的強大軟、硬件支持。

1、集成8NVIDIA A100 GPU

每個NVIDIA DGX A100系統集成了8個NVIDIA A100 GPU,打造面向訓練、推理、數據分析的通用AI解決方案。

NVIDIA A100 GPU基於NVIDIA第8代GPU架構安培架構和7nm製程工藝,包含超過540億個晶體管,AI訓練峯值算力達到312 TFLOPS,AI推理峯值算力為1248 TFLOPS。

與上一代Volta架構GPU相比,NVIDIA A100 GPU的AI訓練峯值算力、AI推理峯值算力提升了20倍。

▲NVIDIA A100 GPU

2、提供320 GB超大內存

每個NVIDIA A100系統使用600 GB/s NVSwitch鏈路連接8個A100 GPU,配備320 GB超大內存,帶寬為每秒12.4 TB。

3、由NVIDIA DGX軟件棧提供支持

除了8塊NVIDIA A100 GPU提供的硬件支持,NVIDIA DGX A100系統還由NVIDIA DGX軟件棧提供支持。

NGC(NVIDIA GPU Cloud)是適應於深度學習、機器學習、高性能計算的GPU優化型軟件中心,可以加速AI模型從部署到開發的工作流程。

據瞭解,用户可以在本地、雲端、邊緣運行NGC目錄中的軟件,也可以使用混合和多雲部署。NGC目錄軟件可部署在裸機服務器、Kubernetes或虛擬化環境中,從而更大限度地利用 GPU,同時儘可能提高應用程序的可移植性和可擴展性。

4、通過Mellanox實現卓越的數據中心可擴展性

今年4月27日,NVIDIA完成對以色列服務器硬件公司Mellanox的收購。通過融合Mellanox的高性能網絡技術,NVIDIA將擁有從AI計算到網絡的端到端技術,以及從處理器到軟件的全堆棧產品。

這意味着相比前兩代產品,NVIDIA DGX A100系統將進一步提升網絡性能及可擴展性。

目前,NVIDIA DGX A100即將開放產品測試申請。

意向用户可通過註冊鏈接進行註冊,並申請產品測試機會。意向用户可通過NVIDIA認證合作伙伴遠程或現場測試DGX A100;亦可諮詢如何在短時間內打造由DGX A100組成的AI 超級數據中心。

收到測試申請後,NVIDIA工作人員將在一週內與申請用户取得聯繫。

申請頁面https://jinshuju.net/f/u69TOj

結語:量身定製的企業智能化轉型解決方案

產業智能化浪潮洶湧而來,千行百業身處其中。對於自身AI計算基礎較弱的企業來説,走好這條智能化轉型之路顯得尤為重要。

一邊是重塑每個業務環節帶來的效率提升,另一邊是難以負擔的高昂成本、AI技術人才的欠缺等各種問題。如何彌合這兩者間的鴻溝,成為面臨這場產業變革的“必答題”。

從這個角度來看,NVIDIA的DGX家族產品,正為這道“必答題”貢獻了一套解決方案。

NVIDIA DGX A100提供強悍的算力、開箱即用的部署方式、強大團隊的技術支持。在即將到來的產品測試中,這款AI計算“大殺器”或將能與迫切期望實現智能化的企業碰撞出更多火花。

譯文內容由第三人軟體翻譯。


以上內容僅用作資訊或教育之目的,不構成與富途相關的任何投資建議。富途竭力但無法保證上述全部內容的真實性、準確性和原創性。
    搶先評論