share_log

华尔街这是”约好了一起唱空“?巴克莱:现有AI算力似乎足以满足需求

華爾街這是”約好了一起唱淡“?巴克萊:現有AI算力似乎足以滿足需求

華爾街見聞 ·  03/27 01:32

巴克萊指出,2025年AI行業有足夠的算力來支持15億到220億個AI Agent。AI行業需從「無意義基準測試」轉向實用的Agent產品部署,低推理成本是盈利關鍵,開源模型將降低成本。儘管算力看似充足,但高效、低成本Agent產品的專用算力仍有缺口。

繼TD Cowen後,巴克萊似乎也開始唱淡AI算力。

3月26日,巴克萊發佈最新研究稱,2025年全球AI算力可支持15-220億個AI Agent,似乎足以滿足美國和歐盟的絕大部分需求。而同日TD Cowen分析師稱支撐人工智能運算的計算機集群供過於求。

巴克萊研報指出,AI行業需要從「無意義基準測試」轉向真正有用的Agent產品部署。同時巴克萊分析師表示:

  • AI Agent市場的增長潛力巨大: 行業算力能夠支持大規模Agent部署,預示着巨大的市場機會。

  • 推理成本是關鍵: 低推理成本對於Agent產品的盈利至關重要,這將驅動對更高效的AI模型和算力的需求。

  • 開源模型的重要性: 開源模型將在降低成本方面發揮關鍵作用,投資者應關注相關領域的動態。

算力供需:過剩還是不足?

關於AI算力的供需平衡,巴克萊展示了幾個核心發現:

  • 行業推理容量基礎:2025年全球約有1,570萬個AI加速器(GPU/TPU/ASIC等)在線,其中40%(約630萬個)將用於推理,而這些推理算力中約一半(310萬個)將專門用於Agent/聊天機器人服務

  • 算力分配正在演變:企業客戶已開始轉向成本更低的開源模型,如Salesforce的Agentforce採用Mistral開源模型(7B-141B參數),而非最昂貴的專有前沿模型;

  • 開源模型下載激增:Hugging Face數據顯示DeepSeek、Llama和Mistral等開源模型的下載量正在迅速增長,這一趨勢將隨着從聊天機器人向Agent的轉變而加速。

算力供應雖然表面上充足,但面臨結構性挑戰。巴克萊明確表示:

如果Agent產品真正起飛並對消費者和企業用戶非常有用,我們可能需要

1)更便宜、更小但性能同樣高的基礎模型(DeepSeek風格);

2)更多推理芯片安裝;以及

3)可能需要將已安裝的訓練GPU重新用於推理。

這表明,雖然目前總體算力看似充足,但針對高效、低成本Agent產品的專用算力仍有較大缺口。巴克萊指出這意味着,在AI Agent賽道上,具有高效推理成本結構和專注開發小型高效模型的公司可能擁有更大競爭優勢,而僅依賴大模型而不考慮單位經濟學的公司可能面臨更大挑戰

推理成本:AI Agent的經濟學挑戰

巴克萊指出AI Agent的推理成本正成爲行業發展的核心考量因素

  • AI Agent生成的Token數量巨大:相比傳統聊天機器人,Agent產品每次查詢生成約10,000個Token,是聊天機器人(約400個)的25倍,這極大增加了推理成本;

不同模型的經濟效益差異巨大:以年度訂閱成本計算,基於OpenAI o1模型的Agent產品成本高達2,400/年,而基於DeepSeekR1模型僅需88/年,後者提供了15倍於前者的用戶容量;

超級Agent需求正在興起:OpenAI計劃推出的"超級Agent"產品,這類高端產品將消耗更多Token,每月高達3,560萬個,每日查詢次數可達44次,遠超普通Agent的2.6次。

從單位經濟學角度看,以Token計價的模式將決定不同模型的市場競爭力。正如巴克萊研究指出:

這證明了低推理成本的重要性。由於其自主性質,Agent AI產品的Token消耗趨勢遠高於聊天機器人。

此外,巴克萊分析師表示,雖然「超級Agent」有潛力,但其高昂的推理成本可能限制其大規模應用。投資者在評估此類產品時,應謹慎考慮其經濟可行性。

057.png投資總是踩地雷?牛牛AI正式上線!精準解答,全方位洞察,掌握關鍵機會!

編輯/danial

譯文內容由第三人軟體翻譯。


以上內容僅用作資訊或教育之目的,不構成與富途相關的任何投資建議。富途竭力但無法保證上述全部內容的真實性、準確性和原創性。
6
評論 評論 8 · 瀏覽 3.5萬

評論(8)

熱點推薦

寫評論
8

聲明

本頁的譯文內容由軟件翻譯。富途將竭力但卻不能保證翻譯內容之準確和可靠,亦不會承擔因任何不準確或遺漏而引起的任何損失或損害。