大模型價格戰“卷”向何方？|深度

財聯社 · 05/25 15:29

①大厂告别“烧钱出奇迹”思维，将基础模型做强做实，尽快缩小与国外技术差距； ②创业公司向垂直纵深探索，做“精”做“尖”大模型行业应用，或许才是国内大模型生态可持续发展之道。

《科创板日报》5月25日讯（记者黄心怡毛明江）你降价，我免费。

在经过一年多的“百模大战”后，AI大模型从5月初几乎毫无预兆地掀起了“降价潮”，阿里、$百度 (BIDU.US)$、腾讯等纷纷加入战团。大厂“钱多、卡多、算力足”无惧价格战，以惯有的免费模式先聚集用户与开发者。中小大模型创业公司普遍还在勒紧腰带苦苦打造爆款应用，也不得不匆忙接招。

大模型价格战“卷”向何方？在《科创板日报》行业采访与观察中，大厂告别“烧钱出奇迹”思维，将基础模型做强做实，尽快缩小与国外技术差距；创业公司向垂直纵深探索，做“精”做“尖”大模型行业应用，或许才是国内大模型生态可持续发展之道。

▍算法革新与模型优化才是价格战背后真正推手

让人始料不及的是，国内率先掀起大模型价格战的是一家“不务正业”的量化私募巨头——幻方。

这些年国内金融量化交易异军突起，幻方通过先进的量化交易在国内市场中赚得盆满钵满。尝到甜头的幻方全力押注AI驱动下的量化交易，所以花重金大量购入$英伟达 (NVDA.US)$、AMD的GPU。业内一度传出“幻方储备的英伟达H100芯片比大厂还多”。

5月6日，幻方旗下DeepSeek发布的DeepSeek-V2，其价格为GPT-4-Turbo的近百分之一。这是大模型降价潮的第一块多米诺骨牌。

5月11日，智谱的个人版GLM-3Turbo调用价格下降5倍。5月15日，字节豆包主力模型将其在企业市场的定价将至0.0008元/千tokens。

接着，阿里通义千问、百度文心一言加入战团。阿里云通义千问9款模型一齐降价，GPT-4级别主力模型Qwen-Long价格直降97%。百度智能云则直接官宣文心大模型两大主力模型ERNIE Speed和ERNIE Lite免费。

最新则是$科大讯飞 (002230.SZ)$、腾讯两家大模型厂商也加入了“价格战”。科大讯飞宣布，讯飞星火API能力免费开放，讯飞星火Pro/Max API低至0.21元/万tokens。而腾讯云主力模型之一混元-lite模型，价格从0.008元/千tokens调整为全面免费。

不过，《科创板日报》记者从采访中了解到，幻方与大厂的降价并不全是“钱多任性”，更多的原因是，ChatGPT大模型推出近两年后，大模型算法革新与模型优化。

国内某头部大模型创业公司负责人告诉《科创板日报》记者，从目前看，算法框架革新主要有两条思路：轻量化和线性化。他特别提到了其公司刚发布的千亿参数MoE架构模型。MoE架构中基于多个专家并行机制，推理时只激活部分专家，以稀疏性压缩了参数数量和推理成本。“这就可以极大地节省算力耗费”。

而率先掀起价格战的幻方DeepSeek-V2，就是其通过架构创新，实现了大模型成本尤其是推理成本下降的结果。据为DeepSeek提供运维技术支持的AMD相关人士表示，DeepSeek-V2采用稀疏MoE架构进行了共享专家等改进，节约了42.5%的训练成本。

无问芯穹发起人汪玉曾用公开数据做了一次针对算力成本数量级的测算，假设GPT-4 Turbo每天要为10亿活跃用户提供服务，每年的算力成本可能超过两千亿，这还不包括模型训练的投入。

因此，算法革新与模型优化下的推理成本下降，才是将来打开AI应用的重要“推手”。

▍抢用户，更要抢“开发者”

阿里云智能集团资深副总裁、公共云事业部总裁刘伟光在宣布降价时明确表示，“（降价）它的目的一定是普惠于市场”，“要真正加速市场的提前爆发”。

对于本轮大模型降价潮，$猎豹移动 (CMCM.US)$董事长兼CEO傅盛评论认为，大模型降价的目标不是为了用户直接使用，而是为了吸引开发者。

短期来看，大模型的性能遇到了瓶颈。“谁也甩不开谁，谁也拿不出杀手锏，降低推理成本、降低售价成了现在每一家的高优先级任务。”

“现在各个大模型App基本都是免费的，本质上是各个大模型App用户量涨不动了，包括OpenAl。最近有些大模型App推广费用奇高，ROI算不过来……必须让更多的开发者参与进来，开发出应用让用户更方便地使用”。

他还认为，大模型降价的核心原因不仅是大模型厂商自己内卷，而是苹果、$微软 (MSFT.US)$、$高通 (QCOM.US)$、联想等设备厂商纷纷重兵投入本地化AI算力和本地大模型的结果，AI PC、AI Phone将成为主流，通用大模型的使用场景会大幅度受限。

对于这乱价格战影响，傅盛表示，这波大模型降价，对企业用户影响有限，开源小参数大模型加应用套件可以满足绝大多数企业需求，虽然套件定制的费用谁也省不掉，但私有化大模型的成本已经很低。

工信部信息通信经济专家委员会委员盘和林认为，降价是为了扩大客户群，未来大模型领域竞争后，最后活下来的企业不会太多，所以，占据规模是从长期考虑，想要在大模型领域获得头部地位。

“中文大模型市场空间当前有限，不可能所有的大模型都获得成功。尤其是大模型作为生态产品，要么赢者通吃，要么落寞退出。当前价格战的背后，是国内大模型应用大同小异的现状，并没有一家企业做出显著的差异性，各家差距不大。只能卷价格。“

对于此次大模型行业的“降价潮”，科尔尼咨询全球合伙人宋旭军认为，主要受供求关系和成本两个方面因素的影响。首先是供求关系变化，竞争的加剧推动各厂商主动降价以争取用户。第二是成本的下降，随着算力成本的下降和模型算法的优化，模型厂商自身的成本也在下降。典型的例子是英伟达GPU和谷歌TPU、华为昇腾性能都在快速提升。

▍拼技术、拼落地、拼解决行业痛点

$阿里巴巴 (BABA.US)$原副总裁贾扬清在朋友圈发布观点表示，“站在整个AI业界的角度，降价是个拍脑袋就可以做的简单策略，但是真正的To B商业成功更难。”

贾扬清现在身份是Lepton AI创始人，他引用一位国际一流咨询公司CIO的话:“今天企业在使用AI的时候，并不是成本驱动的。”“不是说API贵，才没有人用，而是企业首先得搞清楚‘到底怎么用起来产生业务价值’，否则再便宜也是浪费。而今天恰恰实施的这一层是缺的。”

他指出，前面几年各大云厂商都被“项目制”，“咨询服务”这种业务形态给搞怕了，但是新兴技术落地的过程中，必要的咨询服务还是需要的。在贾扬清看来，“也许不是最便宜地赢得商战，而是最能落地的赢得利润。”

元始智能COO罗璇则向《科创板日报》记者表示，现在的降价和免费并不解决当前大模型落地的核心问题，更关键在于模型计算效率要提升10-100倍，算力芯片成本尤其是推理要下降到1/10-1/100，以及解决可解释性的问题，这三点限制了大模型的落地。“单纯的降价，现阶段只是烧钱形成垄断，劣币驱逐良币。”

盘和林分析，此轮头部云厂商的轮番降价，无疑将对大模型初创企业造成竞争压力。

“中小模型企业和初创企业进入这个领域的成本更高，除非做出差异性，在规模上中小企业和初创企业没有机会。”盘和林称。

多名业内人士告《诉科创板日报》记者，AI大模型不能只是拼价格，更要拼技术、拼落地、拼解决行业痛点。大厂告别“烧钱出奇迹”思维，将基础模型做强做实，尽快缩小与国外技术差距；创业公司向垂直纵深探索，做“精”做“尖”大模型行业应用。仅依靠降价带来的利好有限，大模型需要在落地实施、模型计算效率等方面进一步提升。

值得一提的是，在被问及大模型降价对创业公司影响几何时，国内AI圈两个“顶流”李开复与王小川的表态耐人寻味。

百川智能创始人王小川认为，如果（大模型）是面向B端企业客户，那往后就是直接卖云服务的方式，中间的应用层反倒会繁荣起来，有不少新机会。

不过，在王小川也看来，价格免费是优势，但不一定是竞争力。“百川并不会掺和到价格战当中，因为To B不是公司的主要商业模式，价格战的影响也有限。公司会将更多的精力放在超级应用当中。”

创新工场董事长、零一万物CEO李开复谈及价格战时表示，零一万物目前不打算降低YI系列模型的API价格，并认为目前零一万物带给的性能、性价比都很高了，疯狂降价是双输。零一万物的最新千亿参数模型Yi-Large以总榜第7名的成绩，进入了世界权威的LMSYS 盲测竞技场排行榜。

“我觉得我们的价钱是合适、值得的。如果说以后可能中国就是这么‘卷’，大家都宁可赔光、双输也不让你赢，我们就走外国市场。”李开复说。

①大廠告別“燒錢出奇跡”思維，將基礎模型做強做實，儘快縮小與國外技術差距； ②創業公司向垂直縱深探索，做“精”做“尖”大模型行業應用，或許才是國內大模型生態可持續發展之道。

《科創板日報》5月25日訊（記者黃心怡毛明江）你降價，我免費。

在經過一年多的“百模大戰”後，AI大模型從5月初幾乎毫無預兆地掀起了“降價潮”，阿里、$百度 (BIDU.US)$、騰訊等紛紛加入戰團。大廠“錢多、卡多、算力足”無懼價格戰，以慣有的免費模式先聚集用戶與開發者。中小大模型創業公司普遍還在勒緊腰帶苦苦打造爆款應用，也不得不匆忙接招。

大模型價格戰“卷”向何方？在《科創板日報》行業採訪與觀察中，大廠告別“燒錢出奇跡”思維，將基礎模型做強做實，儘快縮小與國外技術差距；創業公司向垂直縱深探索，做“精”做“尖”大模型行業應用，或許才是國內大模型生態可持續發展之道。

▍算法革新與模型優化才是價格戰背後真正推手

讓人始料不及的是，國內率先掀起大模型價格戰的是一家“不務正業”的量化私募巨頭——幻方。

這些年國內金融量化交易異軍突起，幻方通過先進的量化交易在國內市場中賺得盆滿鉢滿。嚐到甜頭的幻方全力押注AI驅動下的量化交易，所以花重金大量購入$英偉達 (NVDA.US)$、AMD的GPU。業內一度傳出“幻方儲備的英偉達H100芯片比大廠還多”。

5月6日，幻方旗下DeepSeek發佈的DeepSeek-V2，其價格爲GPT-4-Turbo的近百分之一。這是大模型降價潮的第一塊多米諾骨牌。

5月11日，智譜的個人版GLM-3Turbo調用價格下降5倍。5月15日，字節豆包主力模型將其在企業市場的定價將至0.0008元/千tokens。

接着，阿里通義千問、百度文心一言加入戰團。阿里雲通義千問9款模型一齊降價，GPT-4級別主力模型Qwen-Long價格直降97%。百度智能雲則直接官宣文心大模型兩大主力模型ERNIE Speed和ERNIE Lite免費。

最新則是$科大訊飛 (002230.SZ)$、騰訊兩家大模型廠商也加入了“價格戰”。科大訊飛宣佈，訊飛星火API能力免費開放，訊飛星火Pro/Max API低至0.21元/萬tokens。而騰訊雲主力模型之一混元-lite模型，價格從0.008元/千tokens調整爲全面免費。

不過，《科創板日報》記者從採訪中了解到，幻方與大廠的降價並不全是“錢多任性”，更多的原因是，ChatGPT大模型推出近兩年後，大模型算法革新與模型優化。

國內某頭部大模型創業公司負責人告訴《科創板日報》記者，從目前看，算法框架革新主要有兩條思路：輕量化和線性化。他特別提到了其公司剛發佈的千億參數MoE架構模型。MoE架構中基於多個專家並行機制，推理時只激活部分專家，以稀疏性壓縮了參數數量和推理成本。“這就可以極大地節省算力耗費”。

而率先掀起價格戰的幻方DeepSeek-V2，就是其通過架構創新，實現了大模型成本尤其是推理成本下降的結果。據爲DeepSeek提供運維技術支持的AMD相關人士表示，DeepSeek-V2採用稀疏MoE架構進行了共享專家等改進，節約了42.5%的訓練成本。

無問芯穹發起人汪玉曾用公開數據做了一次針對算力成本數量級的測算，假設GPT-4 Turbo每天要爲10億活躍用戶提供服務，每年的算力成本可能超過兩千億，這還不包括模型訓練的投入。

因此，算法革新與模型優化下的推理成本下降，才是將來打開AI應用的重要“推手”。

▍搶用戶，更要搶“開發者”

阿里雲智能集團資深副總裁、公共雲事業部總裁劉偉光在宣佈降價時明確表示，“（降價）它的目的一定是普惠於市場”，“要真正加速市場的提前爆發”。

對於本輪大模型降價潮，$獵豹移動 (CMCM.US)$董事長兼CEO傅盛評論認爲，大模型降價的目標不是爲了用戶直接使用，而是爲了吸引開發者。

短期來看，大模型的性能遇到了瓶頸。“誰也甩不開誰，誰也拿不出殺手鐧，降低推理成本、降低售價成了現在每一家的高優先級任務。”

“現在各個大模型App基本都是免費的，本質上是各個大模型App用戶量漲不動了，包括OpenAl。最近有些大模型App推廣費用奇高，ROI算不過來……必須讓更多的開發者參與進來，開發出應用讓用戶更方便地使用”。

他還認爲，大模型降價的核心原因不僅是大模型廠商自己內卷，而是蘋果、$微軟 (MSFT.US)$、$高通 (QCOM.US)$、聯想等設備廠商紛紛重兵投入本地化AI算力和本地大模型的結果，AI PC、AI Phone將成爲主流，通用大模型的使用場景會大幅度受限。

對於這亂價格戰影響，傅盛表示，這波大模型降價，對企業用戶影響有限，開源小參數大模型加應用套件可以滿足絕大多數企業需求，雖然套件定製的費用誰也省不掉，但私有化大模型的成本已經很低。

工信部信息通信經濟專家委員會委員盤和林認爲，降價是爲了擴大客戶群，未來大模型領域競爭後，最後活下來的企業不會太多，所以，佔據規模是從長期考慮，想要在大模型領域獲得頭部地位。

“中文大模型市場空間當前有限，不可能所有的大模型都獲得成功。尤其是大模型作爲生態產品，要麼贏者通吃，要麼落寞退出。當前價格戰的背後，是國內大模型應用大同小異的現狀，並沒有一家企業做出顯著的差異性，各家差距不大。只能卷價格。“

對於此次大模型行業的“降價潮”，科爾尼諮詢全球合夥人宋旭軍認爲，主要受供求關係和成本兩個方面因素的影響。首先是供求關係變化，競爭的加劇推動各廠商主動降價以爭取用戶。第二是成本的下降，隨着算力成本的下降和模型算法的優化，模型廠商自身的成本也在下降。典型的例子是英偉達GPU和谷歌TPU、華爲昇騰性能都在快速提升。

▍拼技術、拼落地、拼解決行業痛點

$阿里巴巴 (BABA.US)$原副總裁賈揚清在朋友圈發佈觀點表示，“站在整個AI業界的角度，降價是個拍腦袋就可以做的簡單策略，但是真正的To B商業成功更難。”

賈揚清現在身份是Lepton AI創始人，他引用一位國際一流諮詢公司CIO的話:“今天企業在使用AI的時候，並不是成本驅動的。”“不是說API貴，才沒有人用，而是企業首先得搞清楚‘到底怎麼用起來產生業務價值’，否則再便宜也是浪費。而今天恰恰實施的這一層是缺的。”

他指出，前面幾年各大雲廠商都被“項目制”，“諮詢服務”這種業務形態給搞怕了，但是新興技術落地的過程中，必要的諮詢服務還是需要的。在賈揚清看來，“也許不是最便宜地贏得商戰，而是最能落地的贏得利潤。”

元始智能COO羅璇則向《科創板日報》記者表示，現在的降價和免費並不解決當前大模型落地的核心問題，更關鍵在於模型計算效率要提升10-100倍，算力芯片成本尤其是推理要下降到1/10-1/100，以及解決可解釋性的問題，這三點限制了大模型的落地。“單純的降價，現階段只是燒錢形成壟斷，劣幣驅逐良幣。”

盤和林分析，此輪頭部雲廠商的輪番降價，無疑將對大模型初創企業造成競爭壓力。

“中小模型企業和初創企業進入這個領域的成本更高，除非做出差異性，在規模上中小企業和初創企業沒有機會。”盤和林稱。

多名業內人士告《訴科創板日報》記者，AI大模型不能只是拼價格，更要拼技術、拼落地、拼解決行業痛點。大廠告別“燒錢出奇跡”思維，將基礎模型做強做實，儘快縮小與國外技術差距；創業公司向垂直縱深探索，做“精”做“尖”大模型行業應用。僅依靠降價帶來的利好有限，大模型需要在落地實施、模型計算效率等方面進一步提升。

值得一提的是，在被問及大模型降價對創業公司影響幾何時，國內AI圈兩個“頂流”李開復與王小川的表態耐人尋味。

百川智能創始人王小川認爲，如果（大模型）是面向B端企業客戶，那往後就是直接賣雲服務的方式，中間的應用層反倒會繁榮起來，有不少新機會。

不過，在王小川也看來，價格免費是優勢，但不一定是競爭力。“百川並不會摻和到價格戰當中，因爲To B不是公司的主要商業模式，價格戰的影響也有限。公司會將更多的精力放在超級應用當中。”

創新工場董事長、零一萬物CEO李開復談及價格戰時表示，零一萬物目前不打算降低YI系列模型的API價格，並認爲目前零一萬物帶給的性能、性價比都很高了，瘋狂降價是雙輸。零一萬物的最新千億參數模型Yi-Large以總榜第7名的成績，進入了世界權威的LMSYS 盲測競技場排行榜。

“我覺得我們的價錢是合適、值得的。如果說以後可能中國就是這麼‘卷’，大家都寧可賠光、雙輸也不讓你贏，我們就走外國市場。”李開復說。

譯文內容由第三人軟體翻譯。

以上內容僅用作資訊或教育之目的，不構成與富途相關的任何投資建議。富途竭力但無法保證上述全部內容的真實性、準確性和原創性。

大模型价格战“卷”向何方？|深度

大模型價格戰“卷”向何方？|深度

風險及免責聲明

聲明