share_log

全球百萬億Token交互背後:開源模型從「一家獨大」到「群雄割據」,中國AI殺入第一梯隊

華爾街見聞 ·  2025/12/05 21:30

OpenRouter平台百萬億Token數據顯示,開源模型市場份額升至33%,打破閉源壟斷。中國開源AI實現歷史性突破,市場份額從1.2%飆升至近30%峰值,Qwen、DeepSeek等躋身全球第一梯隊。市場格局從"一家獨大"轉向多強共治,中型模型(15B-70B)成主流,智能體推理超越文本生成,編程應用佔比突破50%。

基於OpenRouter平台超100萬億Token的實證研究顯示,大型語言模型市場正經歷深刻重構。開源模型份額已攀升至33%,徹底打破閉源模型壟斷,市場格局從DeepSeek的"一家獨大"轉向多元競爭,而中國開源AI在這場變革中強勢崛起,正式躋身全球第一梯隊。

12月4日,硅谷著名風投公司a16z、大模型API平台OpenRouter在共同撰寫的報告中稱,這一變革的核心驅動力來自中國模型的爆發式增長。數據顯示,中國開發的開源模型市場份額從2024年底的1.2%飆升至2025年中近30%的峰值,年平均佔比達13.0%,與世界其他地區開源模型13.7%的份額幾乎持平。Qwen、DeepSeek、MoonshotAI等中國模型憑藉技術能力與本土化適配優勢,實現了從邊緣參與者到核心玩家的跨越。

報告指出,開源生態內部競爭格局同步劇變。2025年中的"夏季拐點"後,市場從DeepSeek家族佔據超50%份額的高度集中,快速走向碎片化競爭。到2025年底,已無任何單一模型能持續佔據超25%的市場份額,用戶選型邏輯從鎖定"最佳模型"轉變爲在5-7個頂尖模型間靈活組合。

此外,研究報告揭示了多個顛覆性趨勢:中型模型(15B-70B)正在替代小模型成爲主流,智能體推理能力超越文本生成成爲核心價值,編程應用佔比從11%飆升至超50%,亞洲市場支出份額從13%翻倍至31%。競爭規則已從排行榜跑分轉向真實世界的使用留存和工作負載匹配能力。

中國力量重塑開源格局

報告稱,開源模型市場已形成"閉源定義性能上限,開源提供多元價值"的雙軌結構。截至2025年底,開源模型的市場份額穩步攀升至33%,這一增長並非短期熱潮,而是由DeepSeek V3、Kimi K2等高質量模型持續迭代驅動。

中國開源模型的崛起速度超出預期。2024年底,中國模型市場份額僅爲1.2%,而到2025年中,其峰值已達近30%。Qwen、DeepSeek、MoonshotAI等中國模型在技術能力與本土化適配上展現出獨特優勢,標誌着中國AI正式殺入開源賽道全球第一梯隊。

從全球區域分佈看,亞洲市場的整體崛起最爲顯著,全球支出份額從研究初期的13%翻倍至31%,成爲關鍵增長引擎。北美雖仍是最大單一區域,但其支出份額已長期低於50%。

語言分佈數據顯示,簡體中文以4.95%的佔比成爲僅次於英語的第二大語言,反映出中國市場的強勁需求。

從壟斷到多強共治

據報告,2024年底的開源市場呈現高度集中格局,DeepSeek家族的V3和R1模型合計佔據超50%的Token使用量,幾乎形成"一家獨大"局面。但這一格局在2025年中的"夏季拐點"後被徹底顛覆。

隨着Qwen、Minimax、Kimi K2、GPT-OSS系列等新晉模型的密集發佈,開源市場競爭壁壘被打破。這些新模型在發佈後數週內便實現大規模生產級應用。到2025年底,已無任何單一模型能持續佔據超25%的開源市場份額。

用戶行爲模式發生根本性轉變。開發者從默認鎖定"最佳模型",轉變爲在5-7個頂尖模型中進行多樣化組合。這一變化標誌着開源生態正式進入"群雄割據"的充分競爭階段,多模型生態成爲行業常態。

"中型即新小型"顛覆尺寸認知

超百萬億Token的實證數據徹底推翻了"開源生態由小型輕量模型主導"的傳統認知。數據顯示,開發者正用實際行動重塑模型尺寸格局。

小型模型(<15B)儘管數量持續增加,但總使用份額不斷萎縮,且市場高度碎片化,難以形成穩定的使用粘性。

相比之下,中型模型(15B-70B)實現了從無到有的爆發式增長,以Qwen2.5 Coder 32B爲代表的中型模型迅速構建起競爭激烈的生態。

這類模型精準匹配了用戶對"能力與效率平衡點"的需求,成爲開源市場的核心增長極,印證了"中型即新小型"的行業新共識。

大型模型(>70B)領域同樣呈現多元化競爭態勢,Qwen3 235B、Z.AI GLM 4.5等模型成爲基準測試核心標的,用戶傾向於在多個頂尖大模型間靈活切換。

應用場景的中國特色

從開源模型的整體任務分佈看,角色扮演以超50%的Token佔比成爲第一大應用,得益於開源模型內容限制較少的天然優勢。編程輔助以15%-20%的佔比位居第二,且份額持續增長。

但中國開源模型展現出顯著差異化特徵。與全球市場"角色扮演主導"不同,中國開源模型的編程加技術類應用合計佔比達39%,超過了33%的角色扮演佔比。

這一差異表明,中國開源模型已在代碼生成、技術推理等生產力領域具備與世界一流模型直接競爭的能力。其價值落點更偏向專業效率提升而非娛樂互動,這種定位可能爲中國模型在企業級市場開闢獨特競爭優勢。

智能體推理引領範式轉移

研究揭示的最具顛覆性發現是LLM使用方式的根本性範式轉移——從單輪文本補全全面轉向多步驟、工具集成的智能體推理工作流。

專爲推理優化的模型處理的通證量從2025年初幾乎可忽略不計飆升至佔總使用量的50%以上。這一變化由供需雙向驅動:

供給側,GPT-5、Claude 4.5等模型的發佈大幅提升了推理能力上限;需求側,用戶愈發青睞能管理任務狀態、遵循多步邏輯、支持智能體式工作流的模型。

伴隨智能體推理崛起的還有兩大關鍵特徵:

提示長度劇增,平均每個請求的輸入通證數從1.5K增長近4倍至6K以上,其中編程任務提示長度超20K,是其他類別的3-4倍;

工具調用日益普及,Claude 4.5 Sonnet、Grok Code Fast等模型領先佈局,標誌着LLM從"文本生成器"向"行動執行器"的本質轉變。

"水晶鞋效應"定義新護城河

研究發現了一批具備超高長期留存的"奠基用戶群",並提出"灰姑娘的水晶鞋效應"框架解釋這一現象,定義了AI時代的核心護城河。

該框架核心邏輯是:市場中始終存在未被滿足的高價值"工作負載";每一代新模型發佈都是一次"試穿水晶鞋"的匹配過程;當模型首次完美解決特定工作負載的技術與經濟約束時,用戶會圍繞該模型構建流程與數據管道,形成極高轉換成本與粘性。

數據印證了這一邏輯:Claude 4 Sonnet、Gemini 2.5Pro的早期奠基用戶群5個月後留存率仍達40%,而Llama 4 Maverick等未實現匹配的模型所有用戶群留存表現均極差。此外,DeepSeek模型還呈現獨特的"迴旋鏢效應",部分流失用戶在嘗試其他模型後會再度回歸。

這一發現揭示,真正的競爭壁壘來自"工作負載-模型"的率先匹配以及由此形成的高粘性奠基用戶群,留存遠比增長關鍵。行業焦點正從排行榜的微小優勢轉向真實世界使用的實證分析與運營優化,從單一模型競爭轉向多模型靈活策略,開源與閉源、東方與西方將長期共存競爭。

編輯/doris

譯文內容由第三人軟體翻譯。


以上內容僅用作資訊或教育之目的,不構成與富途相關的任何投資建議。富途竭力但無法保證上述全部內容的真實性、準確性和原創性。
    搶先評論