點燃中國大模型價格戰！“量化巨頭”如何成爲“AI界的拼多多”

華爾街見聞 · 06/11 16:07

量化方面的AI积累，万卡算力优势，以及“混合专家”的独特架构。

本文作者：赵颖

本文来源：硬AI

2元/百万输出Tokens，DeepSeek-V2大模型推出一周后，便引爆业内“价格大战”。

字节将价格降至0.6元/百万输出Tokens 0.6元人民币，阿里随后将部分大模型价格骤降97%，百度也免费开放了两款文心一言模型......

“大模型黑马”DeepSeek由知名私募巨头幻方量化创立，其推出的DeepSeek-V2不仅性能在众多开源模型中最强，价格也“卷”到了业内最低。

DeepSeek是如何成为“AI界的拼多多”？

最早探索AI的量化之一

DeepSeek的背后离不开幻方量化支持，幻方量化自2015年成立以来，已发展成管理规模约600亿元人民币的大型资产管理公司，其部分利用AI和算法来识别可能影响股价的模式或变量。

幻方量化最初由创始人梁文锋在成都一间公寓内创办，他是浙江大学计算机科学专业毕业生，当时专注尝试自动化股票交易。

到2021年，幻方量化所有策略都在使用人工智能。幻方董事总经理蔡力宇曾表示，人工智能有助于从海量数据集中提取有价值的数据，这些数据可用于预测股价和做出投资决策。

如今幻方利用其积累的AI知识和基础设施创建出MoE大模型DeepSeek-V2，专家表示，该模型的实力与美国主流大模型相当。

DeepSeek-V2的推出迅速引起了业界的广泛关注，这一AI模型不仅能够回答问题、编写代码和进行推理，其成本也显著低于竞争对手，每百万输出Tokens仅需约2元人民币。

这一价格优势引发了中国AI大模型“价格战”，字节、阿里和百度纷纷降低了其AI服务的价格，同时也凸显出中国AI市场竞争的激烈程度。

海量算力优势

DeepSeek的模型能力出众背后离不开充足的算力。

该公司的首个计算集群“萤火一号”耗资近 2 亿元人民币，幻方量化正在投资约10亿元建造第二个超算集群“萤火二号”，该集群规模相当于一个足球场的大小。蔡力宇补充说，幻方的大部分利润都投入到了人工智能基础设施中。

根据该公司网站数据，第二个集群现已完工，将10000万多张英伟达处理器和存储连接起来，使DeepSeek拥有足够的算力训练大模型。

据国盛证券报告，幻方量化是中国六家拥有超过万张A100处理器的公司之一，这通常被认为是自行训练大模型的算力门槛。

此外，DeepSeek模型还采用开源方式，允许研究人员检视其架构并复制。DeepSeek-V2的架构被认为非常独特，采用了混合专家的理念，将模型分成更小的模块，提高了处理效率和准确性。

总部位于美国的AI动画初创公司Cartwheel的首席科学家Andrew Carr表示，DeepSeek将这种称为“混合专家”的想法发挥到了极致，即将模型分成更小的块，拥有数百个小专家。

量化方面的AI積累，萬卡算力優勢，以及“混合專家”的獨特架構。

本文作者：趙穎

本文來源：硬AI

2元/百萬輸出Tokens，DeepSeek-V2大模型推出一週後，便引爆業內“價格大戰”。

字節將價格降至0.6元/百萬輸出Tokens 0.6元人民幣，阿里隨後將部分大模型價格驟降97%，百度也免費開放了兩款文心一言模型......

“大模型黑馬”DeepSeek由知名私募巨頭幻方量化創立，其推出的DeepSeek-V2不僅性能在衆多開源模型中最強，價格也“卷”到了業內最低。

DeepSeek是如何成爲“AI界的拼多多”？

最早探索AI的量化之一

DeepSeek的背後離不開幻方量化支持，幻方量化自2015年成立以來，已發展成管理規模約600億元人民幣的大型資產管理公司，其部分利用AI和算法來識別可能影響股價的模式或變量。

幻方量化最初由創始人梁文鋒在成都一間公寓內創辦，他是浙江大學計算機科學專業畢業生，當時專注嘗試自動化股票交易。

到2021年，幻方量化所有策略都在使用人工智能。幻方董事總經理蔡力宇曾表示，人工智能有助於從海量數據集中提取有價值的數據，這些數據可用於預測股價和做出投資決策。

如今幻方利用其積累的AI知識和基礎設施創建出MoE大模型DeepSeek-V2，專家表示，該模型的實力與美國主流大模型相當。

DeepSeek-V2的推出迅速引起了業界的廣泛關注，這一AI模型不僅能夠回答問題、編寫代碼和進行推理，其成本也顯著低於競爭對手，每百萬輸出Tokens僅需約2元人民幣。

這一價格優勢引發了中國AI大模型“價格戰”，字節、阿里和百度紛紛降低了其AI服務的價格，同時也凸顯出中國AI市場競爭的激烈程度。

海量算力優勢

DeepSeek的模型能力出衆背後離不開充足的算力。

該公司的首個計算集群“螢火一號”耗資近 2 億元人民幣，幻方量化正在投資約10億元建造第二個超算集群“螢火二號”，該集群規模相當於一個足球場的大小。蔡力宇補充說，幻方的大部分利潤都投入到了人工智能基礎設施中。

根據該公司網站數據，第二個集群現已完工，將10000萬多張英偉達處理器和存儲連接起來，使DeepSeek擁有足夠的算力訓練大模型。

據國盛證券報告，幻方量化是中國六家擁有超過萬張A100處理器的公司之一，這通常被認爲是自行訓練大模型的算力門檻。

此外，DeepSeek模型還採用開源方式，允許研究人員檢視其架構並複製。DeepSeek-V2的架構被認爲非常獨特，採用了混合專家的理念，將模型分成更小的模塊，提高了處理效率和準確性。

總部位於美國的AI動畫初創公司Cartwheel的首席科學家Andrew Carr表示，DeepSeek將這種稱爲“混合專家”的想法發揮到了極致，即將模型分成更小的塊，擁有數百個小專家。

譯文內容由第三人軟體翻譯。

以上內容僅用作資訊或教育之目的，不構成與富途相關的任何投資建議。富途竭力但無法保證上述全部內容的真實性、準確性和原創性。

点燃中国大模型价格战！“量化巨头”如何成为“AI界的拼多多”

點燃中國大模型價格戰！“量化巨頭”如何成爲“AI界的拼多多”

最早探索AI的量化之一

海量算力优势

最早探索AI的量化之一

海量算力優勢

風險及免責聲明

聲明