share_log

阿里云放了个大招

阿里雲放了個大招

全天候科技 ·  05/12 10:34

加速AI應用落地。

AI大模型應用正處於爆發的前夕。面對從基礎大模型到行業應用之間的鴻溝,阿里雲決定用力推一把。

5月9日,阿里雲對外正式發佈了通義千問2.5。根據權威基準OpenCompass的測評結果,通義千問2.5得分追平GPT-4 Turbo,打破了國產大模型的新紀錄。

此外,阿里雲還宣佈開源1100億參數模型Qwen1.5-110B。據了解,該模型在MMLU、TheoremQA、GPQA等基準測評中超越了Meta的Llama-3-70B模型。在HuggingFace推出的開源大模型排行榜Open LLM Leaderboard上,Qwen1.5-110B衝上榜首。

在大模型能力上秀肌肉的阿里雲,希望能夠藉此進一步推動大模型落地。

阿里雲首席技術官周靖人表示,“模型的潛力還沒有真正被挖掘出來,在這個時間點,我們希望把最先進的技術開源出來,讓大家做並行探索。”

目前,阿里雲吸引不少開發者加入其中。截至目前,魔搭社區已經有4500個高質量的模型,包含各種各樣的開源模型,開發者的用戶數已經超過500萬,魔搭成爲中國最大的AI模型社區。

如果說開源是爲了推動國內AI生態的發展,避免重複建設,讓部分有能力的企業直接應用。那麼,百鍊平台的升級則是爲了讓大模型和企業場景做更好地結合。

在會上,百鍊平台時隔8個月迎來2.0全面升級,範圍涵蓋模型開發、應用開發和算力底座,不僅引入更多模型,還率先兼容LlamaIndex等開源框架,企業可自由替換能力組件來適配自身系統。

周靖人介紹,當下企業應用大模型存在三種範式,一是對大模型開箱即用,二是對大模型進行微調和持續訓練,三是基於模型開發應用,其中最典型的需求是RAG,以企業數據對大模型進行知識增強。百鍊打造了模型中心和應用中心,以滿足上述需求。

這是一個重要轉變,意味着阿里雲當下的重心已經從模型能力研發嚮應用端轉移。周靖人表示,今年整個應用會逐漸爆發,有越來越多成功的案例,他相信在這方面會有進一步的突破。

AI技術帶動雲計算增量需求,這是人工智能時代的確定性趨勢,也是阿里雲堅定實施“AI驅動”戰略的核心要義。阿里雲認爲,未來絕大部分AI計算將主要在雲上運行。

爲此,兩個多月前,阿里雲進行了史上最大力度的降價,涉及產品超過100款,平均降價幅度超過20%。阿里雲資深副總裁劉偉光認爲,雲計算是一個具備網絡效應和規模效應的商業模式,阿里云爲數百萬客戶提供一個可複用的全球雲計算網絡和資源池,用的客戶越多,成本越低。

如今,阿里雲加快推進大模型在企業端的應用和創新,很大程度上,這也暗含了阿里雲對業績增長的考慮。

2月7日,阿里發佈三季度業績,阿里雲實現營收280.66億元,增速爲3%。業績增長乏力的同時,阿里雲面臨的是高企的大模型訓練成本。雖然有阿里集團的堅定支持,但阿里雲的商業模式終究需要在AI時代自我驗證。

國內大模型的應用和創新才剛剛開始,作爲全球唯一一家做基礎模型研發並開源的雲計算廠商,阿里雲無疑是AI風口上的企業,至於能否將AI機遇轉化成業績潛力,阿里雲還有很長的路要走。

以下爲溝通會實錄(經編輯):

問:阿里雲當時決策開源的時候這個過程怎麼樣?作爲雲廠商,阿里雲自研一個模型本身的意義或者想達到的目的是什麼?

周靖人:開源對整個全球技術領域的貢獻是毋庸置疑的。阿里雲是全球唯一一家積極做AI模型同時也敢於全方位開源的雲計算的廠商,最終目的還是希望能夠把AI技術、能力各個方面能夠賦能到企業和開發者。

模型帶來的一些潛力還沒有真正被挖掘出來,很多開發者或企業的實際業務需求還能有一個翻天覆地的變化,在這個時間點,我們希望能夠以一個開放的心態能夠把最先進的技術開源出來,讓大家做並行的探索。

在AI產品上也一樣,我們會把技術進展以開源方式展現給大家,一方面能力很強,另一方面也提供給大家多種選擇。我們希望通過開源的體系跟企業一起來探索,不僅僅是模型能力提升,更重要的是能夠把模型的前景和潛力深入地挖掘出來。

問:2024年基於MaaS直接開發的很多原生應用都在爆發,未來SaaS軟件和這種AI原生應用的關係是怎樣的?

周靖人:今天各行各業都會因爲AI升級而重新定義自己,重新去發展自己,這個過程裏,有可能誕生一些新的應用。技術發展會催生一些新的業務場景,過去不能完全覆蓋或者支持的場景,在技術迭代過程中又會變成可能,這是我們人類技術發展的一個必然的趨勢。

問:過去SaaS是長在PaaS平台上,未來MaaS跟PaaS之間這種關係會是怎樣的,PaaS的重要性變得越來越薄嗎?

周靖人:沒有,MaaS本身就是長在PaaS上面,今天講模型的訓練、開發、推理都是依賴於阿里雲的PaaS層。我們認爲,在AI時代從IaaS到PaaS到MaaS,所謂底層、中間、上層定義雲計算新的架構,這三層是相互依賴相互促進的作用。

問:從通義千問發佈以來,產業落地的趨勢是什麼?

周靖人:模型一週年,幾個領域越來越清晰。首先,模型本身的能力在快速迭代,從單一語言模型到多模態,整個技術的體系發展是在一個快速上升的渠道。

第二,技術的發展要有好的生態,只有生態的發展才有利於今天整體能夠拿到更多的反饋,有更好業務的創新,激發更多模型的應用。

第三,落地的趨勢也是非常重要的一環。百鍊平台背後支持的是各種各樣的模型,我們希望,有這樣一個平台,能夠真正把模型的能力和業務場景的需求建立一個很好的紐帶,只有這樣才能幫助大模型在各行各業落地。

問:阿里雲的差異化和特點是什麼?現在落地非常火,接下來針對落地,你的重點的工作是什麼?

周靖人:大模型最後比拼的就是能力,差異就是能力。今天做大模型的公司有這麼多家,說的是同樣的故事,最後就是看技術能力和產品能力,怎麼能夠落地的能力。

第二個問題,我覺得至少在過去一年裏面,前期可能有很多期望,但是落地過程中不是那麼順利,它涉及基礎模型本身的能力,還有各種各樣的規範、數據等,這必然需要有一個平台,這是爲什麼花了那麼多篇幅講百鍊。

問:通義要用大模型把整個阿里的產品重新做一遍,內部重做一遍的進度是什麼,內部使用百鍊的場景以及程度是什麼?

周靖人:應該說阿里體系比較龐大,AI能力在各種場景裏面應該說是快速地展現出來,比如說釘釘,釘釘背後的所有AI能力都是通義提供的。

問:這是一個產品一個產品改造的邏輯,還是先搭一個底層產品平台,然後再在產品層面體現?

周靖人:和對外提供的產品一樣,阿里雲提供的是基礎模型能力,淘系、釘釘、夸克搜索等都有自己業務的場景,會結合場景再結合模型的能力進行業務的創新和開發,這不僅僅是AI能力,還涉及業務創新、產品創新的方方面面。

問:阿里雲在AI時代如何繼續保持這個領先者的地位,核心競爭力是什麼?

周靖人:在AI時代,阿里雲技術體系是走在最前面的,我們要把先進的能力,結合產業應用真正賦能給大家,要應用到具體的場景裏,只有這樣,在AI時代阿里雲仍然是No.1。

問:1月阿里雲在新加坡發佈了一系列AI產品,今天產品升級之後是否會涉及海外業務這塊相關的迭代升級?阿里雲在海外的佈局規劃是怎樣的?

周靖人:相關的模型能力,包括百鍊,會逐漸服務到海外市場,因爲本身阿里雲就是一個面向國際的雲計算廠商。

問:阿里雲對於客戶、開發者帶來了積極意義,這些有沒有給阿里雲自身帶來一些正向的影響,比如說對雲的需求量有沒有提升?

周靖人:我們整體也不完全是功利的心態在做,不然的話你的出發點就是不太純正。我們認爲,今天整個生態的發展非常重要,這是爲什麼不僅僅是講到通義,也講到魔搭社群,讓更多的人蔘與進來,只有這樣把這個蛋糕做得更大,才能帶來整個行業發展。

問:通義如何去幫助中小企業和成長型企業做業務?

周靖人:百鍊就是我們朝着這個方向走出的最重要的第一步。讓中小企業在各種場景裏面都能使用模型,是不容易的,直接調用,微調及模型的二次優化,深度的指令PROM優化,穩定的支持體系等,這些都是我們要幫助中小企業去提供的能力。

編輯/emily

譯文內容由第三人軟體翻譯。


以上內容僅用作資訊或教育之目的,不構成與富途相關的任何投資建議。富途竭力但無法保證上述全部內容的真實性、準確性和原創性。
    搶先評論