share_log

点燃中国大模型价格战!“量化巨头”如何成为“AI界的拼多多”

wallstreetcn ·  Jun 11 16:07

量化方面的AI积累,万卡算力优势,以及“混合专家”的独特架构。

本文作者:赵颖

本文来源:硬AI

2元/百万输出Tokens,DeepSeek-V2大模型推出一周后,便引爆业内“价格大战”。

字节将价格降至0.6元/百万输出Tokens 0.6元人民币,阿里随后将部分大模型价格骤降97%,百度也免费开放了两款文心一言模型......

“大模型黑马”DeepSeek由知名私募巨头幻方量化创立,其推出的DeepSeek-V2不仅性能在众多开源模型中最强,价格也“卷”到了业内最低。

DeepSeek是如何成为“AI界的拼多多”?

最早探索AI的量化之一

DeepSeek的背后离不开幻方量化支持,幻方量化自2015年成立以来,已发展成管理规模约600亿元人民币的大型资产管理公司,其部分利用AI和算法来识别可能影响股价的模式或变量。

幻方量化最初由创始人梁文锋在成都一间公寓内创办,他是浙江大学计算机科学专业毕业生,当时专注尝试自动化股票交易。

到2021年,幻方量化所有策略都在使用人工智能。幻方董事总经理蔡力宇曾表示,人工智能有助于从海量数据集中提取有价值的数据,这些数据可用于预测股价和做出投资决策。

如今幻方利用其积累的AI知识和基础设施创建出MoE大模型DeepSeek-V2,专家表示,该模型的实力与美国主流大模型相当。

DeepSeek-V2的推出迅速引起了业界的广泛关注,这一AI模型不仅能够回答问题、编写代码和进行推理,其成本也显著低于竞争对手,每百万输出Tokens仅需约2元人民币。

这一价格优势引发了中国AI大模型“价格战”,字节、阿里和百度纷纷降低了其AI服务的价格,同时也凸显出中国AI市场竞争的激烈程度。

海量算力优势

DeepSeek的模型能力出众背后离不开充足的算力。

该公司的首个计算集群“萤火一号”耗资近 2 亿元人民币,幻方量化正在投资约10亿元建造第二个超算集群“萤火二号”,该集群规模相当于一个足球场的大小。蔡力宇补充说,幻方的大部分利润都投入到了人工智能基础设施中。

根据该公司网站数据,第二个集群现已完工,将10000万多张英伟达处理器和存储连接起来,使DeepSeek拥有足够的算力训练大模型。

据国盛证券报告,幻方量化是中国六家拥有超过万张A100处理器的公司之一,这通常被认为是自行训练大模型的算力门槛。

此外,DeepSeek模型还采用开源方式,允许研究人员检视其架构并复制。DeepSeek-V2的架构被认为非常独特,采用了混合专家的理念,将模型分成更小的模块,提高了处理效率和准确性。

总部位于美国的AI动画初创公司Cartwheel的首席科学家Andrew Carr表示,DeepSeek将这种称为“混合专家”的想法发挥到了极致,即将模型分成更小的块,拥有数百个小专家。

The above content is for informational or educational purposes only and does not constitute any investment advice related to Futu. Although we strive to ensure the truthfulness, accuracy, and originality of all such content, we cannot guarantee it.
    Write a comment