share_log

对话阿里云CTO周靖人:大模型降价不是价格战,现在的价格还不够低

對話阿里雲CTO周靖人:大模型降價不是價格戰,現在的價格還不夠低

智東西 ·  09/20 11:15

智東西(公衆號:zhidxcom)

作者 | ZeR0

編輯 | 漠影

「我們不認爲這是價格戰。」被問到國內大模型持續降價的趨勢時,阿里雲智能集團CTO周靖人談道,「今天的價格不存在說已經足夠低了,相對未來龐大的應用來說,還是太貴了。」

他打了個比方:「你今天覺得便宜了,今天上網多少錢一個月?手機上網費,我的手機套餐不到200元,但是今天200元能用幾十個G的流量,你能在二十年前想象這個事兒嗎?今天的流量,你要是在二十年前估計得用破產。」

2024雲棲大會主論壇開幕首日,周靖人代表阿里雲公佈了通義大模型的一系列年度重磅發佈,其中阿里雲通義千問三款主力模型再度大幅降價,最高降幅85%,百萬tokens價格低至0.3元。(全球開源大模型新王!阿里Qwen2.5來了,性能跨量級超Llama3.1)

在會後媒體問答環節,周靖人與阿里雲副總裁、公共與客戶溝通部的總經理張啓就大模型持續降價、開源與閉源路徑選擇、對OpenAI o1模型的看法、對AI算力趨勢的預判等業界關注話題逐一作答。

周靖人認爲,OpenAI新模型o1是一個非常具有代表性、革命性的方向,讓模型自動分析、策劃、試錯等,這一系列能力在各種各樣場景裏都能完成比較魯棒性的表現,指明瞭一條今天可行的道路;今後模型預訓練和推理都會大量使用算力,也會把這部分通過強化學習方式有效拓展開來。

一、全線降價主要通過技術優化,將紅利讓渡給企業級用戶與開發者

據周靖人分享,通義千問此次全線降價主要是借勢規模效應,通過技術的優化、資源的調度,從雲基礎設施提升到模型優化,都能夠將模型推理成本進一步降下來,阿里雲希望將這樣的技術紅利給到企業級用戶及開發者,從而帶動整個產業的發展。

「今天模型的運用,包括模型各種各樣的創新,現在還在早期的階段。」周靖人談道,很多新模型的迭代、Agent的使用都會大量併發、被模型調用,如果模型推理很昂貴,開發者難以有效大規模使用,因此阿里雲會堅定不移推動社區及行業的發展,以激發更多產業級創新。

這與阿里雲做開源的邏輯殊途同歸。他補充說,從去年開始,阿里雲非常堅定不移地做開源,希望有更多人能夠利用開源能力,推動生態發展。同時,針對一些閉源的、企業級的客戶,阿里雲希望爲這些有特殊要求的客戶提供一個極致的能力。

「我們把選擇權給到企業,同時即使我們開源,我們希望在雲平台上提供服務時,也提供極致的性價比。一方面,我們希望生態的發展。另一方面,我們還是希望能更有效服務到企業。」周靖人透露道,阿里雲不僅希望通過開源使大家能將模型能力用起來,同時也要降低模型使用的成本,每一次降價是一個非常嚴肅的過程,會從整個產業的發展及開發者、企業用戶的反饋等各方面進行權衡。

張啓補充道,國內外大方向都是不斷降價,基礎設施只有把資費降到足夠的低,才有可能未來更好的發展,不能現在簡單算一個投資回報率。

他提到一個說法,現在的AI相當於1996年左右的互聯網,也就是BBS時代,當時上網資費很貴,後來互聯網和移動互聯網發展,運營商大興基建,現在我們也在瘋狂地推進AI大基建,把資費降下來,才有可能去談未來應用的爆發。

「所以這個長遠的目標,才是我們考慮更多的事情。而不是說今天一定要算一個賬,馬上就能夠賺多少錢,或者馬上又到什麼樣的一個目標。」張啓說。

二、開源模型做到全球第二,獲得海內外開發者認可

阿里雲一直將大模型生態繁榮作爲首要目標,目前其魔搭社區已成爲中國最大的模型社區,擁有超過690萬個開發者用戶,與行業合作伙伴合作貢獻了超10000款模型。

周靖人談道,阿里雲是一家以技術爲主的公司,在各方面都有前瞻性的一些佈局和思考,阿里雲的技術體系經過長期演進,通義千問的前身通義系列預訓練大模型便是這一波AI浪潮到來前阿里雲前瞻性佈局的一個代表。

在業務層方面,阿里雲從去年開始宣稱「要成爲AI時代最開放的雲」。周靖人說,這是非常具有事實依載的一句話,今天通義模型生態已經發展到全球第二,僅次於美國Llama,開源社區蓬勃發展。

其中「全球第二」來自於Hugging Face全球模型的分析,當前Llama衍生模型數量是全球第一;短短一年內得到全球開發者認可的通義模型排名全球第二,正在高速發展過程中。

通義開源模型累計下載量已經突破4000萬,通義原生模型和衍生模型總數超過5萬,成爲僅次於美國Llama的世界級模型群。

另外在模型能力方面,阿里雲最新推出的Qwen2.5系列開源模型,一些具體指標已經超過Llama 3.1 405B。阿里雲希望也能夠把相關一系列技術創新能力更好讓開發者使用起來。

阿里雲此次共開源,創大模型開源史上之最。周靖人談道,阿里雲推出不同規格的模型,以便將把更多選擇權留給開發者,使開發者可以根據自己的業務場景去做選擇。

此外,他補充說像Qwen這樣的模型系列受到了海內外廣泛開發者的喜愛,認知度非常高,這也有助於阿里雲出海業務的開展。

三、算力市場飛速轉向AI計算,AI基建升級託載大模型創新

在開幕式年度技術發佈環節,周靖人提到雲廠商擁有全棧技術儲備,並通過基礎設施的全面升級,讓AI訓練、推理、部署和應用整個生命週期變得更高效。

阿里雲正在圍繞AI時代,樹立一個AI基礎設施的新標準,全面升級從服務器到計算、存儲、網絡、數據處理、模型訓練和推理平台的技術架構體系,讓數據中心成爲一臺超級計算機,爲每個AI和應用提供高性能、高效的算力服務。

周靖人在會後接受採訪時進一步強調說,模型更新離不開基礎設施,AI技術變革是一個系統化的技術變革,如果沒有底層的相關能力的支持,今天模型的研發、迭代等方方面面則沒有承載的地方,這是一個相輔相成、承上啓下的關係。阿里雲最新分享的一系列基礎設施進展,也在引領行業的發展。

在他看來,「AI的基礎設施」中間有很多細微且重要的創新,正是因爲這些重要的創新,才讓今天大模型的訓練與創新變成了可能。

張啓補充道,阿里雲在雲棲大會上的所有發佈,都是圍繞着「一張遍佈全球的理想的AI雲計算網絡」去打造。

他提到整個算力市場上新增的算力需求中,AI算力需求已經超過了50%。這個速度非常之快,意味着整個算力市場正在飛速的從原來的CPU轉向AI計算。

談及對算力趨勢的預測,周靖人認爲模型仍在創新、不斷迭代,還沒有一個固定的範式,所謂算力的分佈到底是預訓練居多還是推理的居多,或者說中間的比例有什麼樣的變化,大家都有各種各樣的嘗試,還沒有一個完全的定論。

在他看來,如何有效把算力利用好,仍是整個行業所需要去解決的一個問題。要把好鋼用在刀刃上,哪一部分持續去做Scaling Law能夠達到更好的return?還是通過強化學習方式,能夠進一步提升模型對於人類問題的解答?這些當前都沒有定論。他相信每個技術團隊都在做各個方面的探索。

結語:技術創新不能閉門造車,需與商業邏輯有機結合

周靖人認爲,今天整個AI產業帶來的變化是深遠的。他非常歡迎創業公司的創新,因爲這個時代需要更多優秀人才在各個領域進行探索、突破;科技創新不是隻有一條路,希望大家通過各種的渠道、思考,不斷推進科技發展浪潮。今天各種各樣創業公司已經在基於通義模型生態做創新,阿里雲樂意與更多創業公司合作,爲他們提供很好的支持。

在他看來,現在企業CTO要保持技術優勢,關注前瞻性的技術佈局,還要理解整個技術如何被利用好,不能閉門造車,而更多是希望造出來的技術能夠有效被市場、被企業客戶所用。周靖人說,阿里雲在聆聽開發者的需求方面做得非常突出,能夠容納大家各種各樣的需求,並將大家的反饋作爲技術創新重要的輸入,這些都是與其整個商業邏輯、技術體系有機的結合,是「雙輪驅動」。

譯文內容由第三人軟體翻譯。


以上內容僅用作資訊或教育之目的,不構成與富途相關的任何投資建議。富途竭力但無法保證上述全部內容的真實性、準確性和原創性。
    搶先評論