share_log

政企向大模型转身,阿里云十年打磨一把「锤」

政企向大模型轉身,阿里雲十年打磨一把「錘」

極客公園 ·  09/23 21:42

今年 4 月,大模型能力第一次紮實的嵌進了陝煤建新煤礦等十餘座礦山裏。

礦山重大風險辨識、告警預警及處置,對安全生產與管理至關重要。在過去很多年裏,雖然通過對圖像數據的標註、訓練,基於機器視覺模型的風險辨識在業內已相對成熟,但告警、處置環節仍高度依賴人工。

在煤礦調度指揮中心,調度員需時刻關注十餘塊監控屏幕,發現風險問題後手動創建處置文檔、填寫問題描述、查閱處置依據,並最終給出處置辦法。

處置依據多且龐雜,以 2022 年 1 月第二次修訂的國家級煤礦安全規範爲例,共有 719 條。各座礦山會依據各自地質、施工條件,對規範再做增補。在人工處置期間,還可能遺漏重點區域發生的其它風險。「因此,缺了告警處置這一環,就無法實現自動化真正的閉環,也無法保證真正的安全。對礦業來說,這一直是個非常棘手的問題。

直到今年一套礦山重大風險辨識處置新系統應運而生。實時採集的礦山圖像數據、環境數據和相關業務場景知識庫「喂」給大模型後,大模型對礦山場景、區域、安全風險內容、管理規範、處置措施等信息進行抽取、訓練、學習後,具備了實時推理、實時處置的能力。

現在這套系統可以自動處置常規風險,調度員只需要把精力放在少數複雜場景上。

礦業所在的能源行業是大模型發揮作用的經典場景之一。

據中央網信辦今年 8 月透露,截至目前,我國完成備案並上線、能爲公衆提供服務的生成式人工智能服務大模型已達 190 多個,遍佈在交通、教育、製造、醫療這七大行業,註冊用戶數超過 6 億。

2023 年之前國內企業數字化轉型建設內部不成體系、煙囪林立的情況在大模型出現後迎來了轉機,到現在,政企正在成爲大模型最積極的擁抱者之一。

01 兩輪技術浪潮的雜糅

政企數字化轉型是中國企業數字化轉型中最複雜而艱澀的樣本。

以阿里雲智能集團副總裁、產品解決方案部總經理霍嘉的話來說,「坦白講,今天在中國發生的數字化轉型,只能說大部分才剛剛開始,離結束還早得很,而且有兩輪技術的疊加」。

最初的政企數字化轉型,是從以流程驅動爲核心的信息化開始的——說的更簡單一點,即業務的在線化。但國內政企普遍規模龐大,業務線廣而複雜,每個業務都有自己獨立的系統,這導致了政企數字化中「煙囪林立」的現象。

由於政企部門業務的敏感性,這種數字化需要高度的定製化,這也導致 IT 建設負擔沉重。

而當數字化轉型從信息化時代進入數據驅動時代,政企圍繞「數據」進行核心業務的「再造」。這個過程,大量數據中臺先後出現。但數據驅動本質上並未解決數據在各個業務煙囪之間相互隔離的矛盾,數據中臺與業務並沒有緊密結合。

眼下的大模型則是數字化轉型迎來的第三輪技術浪潮,與上一輪「數據驅動」浪潮並行。大模型讓人可以直接與數據、機器互動,天然帶有靠近業務的特徵,其最大的價值之一就在於和業務場景的融合,以顛覆舊的業務形態,而這也更接近數字化轉型本身所追逐的本質。

對大模型價值的審視或許是中國企業在多年數字化轉型的過程中第一次集體性的回過頭來認真度量和理解自己的業務——數字化轉型不是結果,而是解決業務問題的手段。

「最終目的還是業務場景。我們跟很多客戶談的時候,會發現有的時候大家會把手段跟目的給弄混掉」,阿里雲智能集團副總裁、解決方案研發部總經理曾震宇表示,「先明確要解決的問題,再看用什麼方式解決。這個解決的過程可能就叫數字化轉型的過程。如果說業務場景不想清楚就要做數字化轉型,往往這種項目做到後面大家都會很吃力,因爲不知道到底要解決一個什麼問題」。

阿里雲智能集團副總裁、解決方案研發部總經理曾震宇

大模型的巨大潛力,讓政企看到了對自身業務甚至重新梳理整個企業組織結構的價值。這也讓大模型技術能夠成爲政企數字化轉型得以跳出一場場爲數據所困的小範圍局部戰爭的契機。

但政企在有了充分藉助大模型來實現自身數字化轉型的需求之後,面臨的仍然是一個嚴峻的局面。

02 模型與算力的雙重困境

擺在眼前的事模型本身的選擇和塑造方向。換句話說,政企需要怎樣的大模型?

首要的是,大模型需要能夠支撐海量非結構化數據的查詢分析。

政企業務規模龐大,數據量往往遠超一般企業,這對大模型的處理能力提出了極高要求。例如,城市政務需要實時處理來自交通、安防、環保等多個部門的海量數據;金融機構需要對複雜交易數據進行風險分析和預測。而這些數據往往是非結構化的,比如圖表、公式,甚至一些紙質合同等。這需要大模型用 RAG 等技術進行知識管理,以高效地處理、分析海量數據。

而與一般企業不同,政企業務需要維持全年 365 天每時每刻的穩定可用,政企業務系統往往對穩定性和可靠性要求極高,深入政企業務的大模型需要在長期持續運行中保持穩定,避免出現性能波動或意外中斷。

而由於政企業務的特殊性,其對大模型有着極高的數據安全需求。私有化部署是政企在引入大模型時處於保障數據安全的重要手段,政企的數據得以不離開政企內部,並通過嚴格的訪問控制機制防止數據泄露。

這要求大模型提供靈活的部署方式,支持私有化部署、混合部署等多種模式。同時,還需要採用數據加密、脫敏等技術手段,全方位保障數據安全。此外,還需要關注大模型自身的安全問題,例如模型竊取、對抗攻擊等,並採取相應的防護措施。

而大模型能在政企的數字化轉型過程中着力的最重要一點——大模型需要懂業務,並且能動態的跟上業務的變化。

「懂業務」意味着大模型不能僅僅停留在通用能力上,而要深入理解政企所處行業的專業術語、業務流程和監管要求。這要求大模型在預訓練階段就要引入大量的行業數據進行訓練形成 Knowhow。

但業務永遠在變化,這意味着大模型另有在實際應用中結合具體業務場景不斷進行調整的需求。但懂業務的企業內部人員不一定懂模型,這意味着大模型需要在訓練層面簡單易懂,並且爲業務人員構建便捷的知識注入和更新機制,讓後者能夠參與到模型的訓練和優化過程中,把專業知識和經驗融入到大模型裏。

解決了「什麼樣的大模型適合自己「的問題之後,政企還有另一道題要解,即「如何訓練適合自己業務的大模型」。

政企對大模型嚴苛的需求,進一步凸顯出大模型訓練背後繞不開的算力問題,這是政企將大模型順利引入自身業務之前所面對的另一個問題。

中國並不缺智算中心,但缺的是可用的算力。現在大模型的訓練需要的是規模化的算力。以基礎模型訓練來說,萬卡集群的規模已經是底線,要保證一定質量的話則需要兩萬張卡以上。哪怕退而求其次的垂直模型,也需要千卡級別的算力集群支撐,這種集群規模對於政企來說是非常大的挑戰。

政企在當下數字化轉型中遇到的大模型與算力難,看似存在於兩端,但實際有非常緊密的聯繫,將兩者聯繫起來的是承擔着將大模型引入政企業務中的雲廠商。

阿里雲智能集團研究員、阿里雲智能集團副總裁、專有云總經理劉國華在拜訪了包括很多客戶後,得到了政企客戶一個樸素而普遍的觀點。現在的中國政企客戶關心的是兩件事情,第一個是安全穩定的問題,第二個是成本。隨着大語言模型的發展,AI 給政企客戶的業務帶來了新的突破點,但與此同時他們又要兼顧整個安全和成本的問題。」

阿里雲智能集團研究員、阿里雲智能集團副總裁、專有云總經理劉國華

「基於此,政企客戶更加期望雲平台是滿足雲+AI 協同發展的要求,而不是單一各自去做各自的事情,來最大化提升整體的成本效率。」劉國華表示。

「下礦」近半年之後,阿里雲從算力層和模型層,爲政企客戶帶來了更優解。

03 雲+AI 一體化的技術體系

「今天談到大模型算力基礎設施的時候,它絕對不是單單數機器和數卡,不是把一堆硬件隔在一起,而是通過雲計算的平台把芯片、服務器、網絡、存儲這些東西有機的調動起來,才能集成模型的訓練。」阿里雲智能集團副總裁、產品解決方案部總經理霍嘉在雲棲大會上表示。

阿里雲智能集團副總裁、產品解決方案部總經理霍嘉

對於政企所看重的安全問題,阿里雲在底層算力層的飛天企業版上實現了「智算升級」。

首先是在計算性能上的變化。

在異構算力池化方面,針對政企中 GPU 的異構現狀,現在整個平台支持多芯的 GPU 融合管理。目前飛天企業版支持 23 款的 GPU 接入跟管理,支持單一集群 1.5 萬卡的建設,並且實現通用算力、超算、智算的一網調度。

目前飛天企業版的 GPU 虛擬化和容器調度算力切分粒度達到 1%,資源利用率提升 100%;基於訓推資源調度一體化平台,通過訓推任務和資源調度策略結合,飛天企業版將算力資源碎片減少 30%。

而在在推理場景性能方面,通過 GPU 推理調度算法優化,飛天企業版在單機多卡並行式訓練中可自動選擇最優通信鏈路,通信帶寬最大可提升 100%。在資源調度上,模型吞吐量提升 23%;通過對 GPU 深度調優,飛天企業版 GPU 性能較社區版提升 10%。

在端到端系統穩定性方面,飛天企業版提供從訓練任務到底層基礎設施的一體化監控和分析診斷能力,針對故障節點和受影響的作業路徑可實現分鐘級定位和診斷,整體故障監控覆蓋率達到 80%。

兼容性方面的提升則不止在與多種 GPU 融合的方面有所體現。

阿里雲提供的一站式 AI 大模型開發平台——百鍊專屬版。在 AI 的服務層提供了從開發、訓練、推理到智能體搭建的服務,兼容整個主流的開源模型。

這意味着未來很多客戶可以直接基於阿里雲的平台去構建他的模型生態,讓更多的模型可以更靠近它想要服務的客戶。

在此之前,阿里雲於 2023 年 10 月首次推出了百鍊平台。該平台集成了國內外主流優質大模型,提供模型選型、微調訓練、安全套件、模型部署等服務和全鏈路的應用開發工具,爲用戶簡化了底層算力部署、模型預訓練、工具開發等複雜工作。

而針對政企市場面臨一系列大模型落地「難題」,阿里雲在 2024 年推出的百鍊專屬版。此次百鍊專屬版 2.0 在底層算力上,進一步兼容了「公共雲 VPC」和「專有云」環境,並已嵌入阿里雲「飛天企業版」雲平台;支持多芯異構的算力調度,支持多租戶模式下的算力、模型、數據隔離與共享。

在大模型訓推方面,百鍊專屬版 2.0 支持高性能分佈式訓練,訓練吞吐率提升 20%;基於軟硬協同的推理加速,將精度無損量化提升至 0.5%,推理速度提升 3 倍以上。

在模型方面,百鍊專屬版 2.0 預置了通義 7B 到 72B 多尺寸大語言基礎模型及多模態大模型,同時兼容主流模型框架、支持三方大模型自定義接入。

在模型服務方面,百鍊專屬版 2.0 支持圖表、公式、圖片、音視頻,以及大文件和巨量文件的解析;基於平台豐富的工具和插件,開發者可通過「拖拉拽」快速搭建智能體。

數字化轉型方興未艾,智能化時代的浪潮已至。雲計算與大模型的微妙關係耦合成一條新的政企數字化轉型道路,而飛天企業版和百鍊專屬版則構成了一套完整的智能化時代雲計算技術體系。

04 敏銳來自十年深耕

2023 年 4 月末,第六屆數字中國建設峯會在福建福州舉辦的時間點,正是大模型第一波浪起的時候,彼時一場並不起眼的分論壇上,阿里雲智能的副總裁霍嘉、阿里雲智能副總裁、解決方案研發部總經理曾震宇等人少見的有一次同台。

在那次集體亮相之前,阿里雲啓動了一項「通義千問夥伴計劃」,合作的夥伴覆蓋油氣、電力、交通、金融、酒旅、企服、通信行業。

阿里雲在去年 4 月就把企業雲服務因爲大模型而發生變革放在非常重要的位置,現在來看,這像是非常有預見性的一枚石子,在投出將近一年半之後,水暈才真正盪開。

這種敏銳並不是來自個人判斷,而是受益於阿里雲多年在政企業務所下的苦功。

2014 年,阿里雲陸續開始與中國氣象總局合作,海量氣象數據湧入通過阿里雲計算平台;同年,阿里雲與藥監局合作,藥品監管網數據從甲骨文轉移到了阿里雲;2015 年阿里雲成爲海關總署的雲計算和大數據服務服務商;2021 年之後,國家醫療保障局醫保信息平台開始跑在阿里雲商。

到目前爲止,阿里雲已服務超 1000 家政企客戶,覆蓋 90% 的央國企(央企及省級國企)。6 大國有商業銀行、2 大電網、中石化、中國郵政等都已跑在阿里雲上。

所有的企業類型中,政企中有中國企業數字化裏最複雜的難題,而對於一家中國雲廠商來說,要想服務好政企市場,就必須在政企業務中扎根。

阿里雲陪伴了中國政企數字化最洶湧的十年,這也讓阿里雲在眼下大模型重新定義企業數字化的時候,顯得更清醒。

「數字化轉型本質上是業務轉型,組織升級,最後是技術助力。在數字化轉型的過程中,上雲只是個技術手段」,霍嘉表示,「不要過度高估數字化對業務轉型帶來的直接效果,數字化更多是一個加速器」。

而在這個從信息化到數字化的轉型過程中,大模型的價值是讓人類在技術上第一次可以去大規模的降低和軟件——或者說數據——交流的門檻。這也讓企業有機會重新審視內部積累起來的數據,結合新的業務場景,基於大模型的能力去進一步挖掘價值。

但這件事才剛剛開始。

而阿里雲想要做的,是把大模型這把「錘子」的原料和鍛造經驗,直接交到政企手上。

*頭圖來源:阿里云云棲大會

本文爲極客公園原創文章,轉載請聯繫極客君微信 geekparkGO

譯文內容由第三人軟體翻譯。


以上內容僅用作資訊或教育之目的,不構成與富途相關的任何投資建議。富途竭力但無法保證上述全部內容的真實性、準確性和原創性。
    搶先評論