中國不只有DeepSeek，阿里除夕夜拋出重磅新模型，是時候整體重估中國AI資產了嗎？

華爾街見聞 · 01/29 04:11

当阿里云展现出"强大模型+充足算力+完整云平台"的组合优势时，是否印证了类似去年北美云计算服务商的投资逻辑？

农历除夕夜，在全球华人喜迎新春之时，纽约证券交易所的电子屏上，$阿里巴巴 (BABA.US)$美股股价在收盘前出现显著异动——从涨幅1%快速拉升至6.7%。

行情异动的背后，是一场没有硝烟的技术奇袭。

1月29日凌晨，阿里通义千问团队悄然上线的大模型Qwen2.5-Max，在多个权威基准测试中展现出与全球顶级模型比肩的性能。

继DeepSeek之后，Qwen2.5-Max的发布是中国AI阵营在高性能、低成本技术路线上的又一重要突破。

市场人士分析称，此前过度聚焦DeepSeek，却忽视了包括阿里通义在内的中国AI整体性追赶。行业媒体《信息平权》表示，若阿里Qwen-2.5-max这次的确性能超过V3，可以对其RL推理模型给予更大期待。

进一步，当阿里云展现出"强大模型+充足算力+完整云平台"的组合优势时，是否印证了类似去年北美云计算服务商的投资逻辑？如果美股因AI整体增值10万亿美元，中国AI资产的重估时机是否已至？

全面对标全球顶级模型，百万token里程碑

Qwen2.5-Max采用超大规模MoE（混合专家）架构，基于超过20万亿token的预训练数据。

在测试大学水平知识的MMLU-Pro、评估编程能力的LiveCodeBench、综合能力评估的LiveBench，以及近似人类偏好的Arena-Hard等多个权威评测中，该模型均展现出与DeepSeek V3、GPT-4和Claude-3.5-Sonnet比肩，甚至领先的性能。

阿里团队表示，随着后训练技术的不断进步，下一个版本将有望达到更高水平。

Qwen2.5团队同步发布了两个创新型号：Qwen2.5-7b-instruct-1m和Qwen2.5-14b-instruct-1m。这些开源模型支持高达100万token的上下文窗口，成为业内首个达到此规模的公开可用模型。

这些模型使用稀疏注意力，只关注上下文中最重要的部分。这种方法处理百万token输入的速度比传统方法快3到7倍，输出长度可达8000个token。然而，这需要模型识别上下文文档中的关键段落——这是当前语言模型经常难以完成的任务。

在测试中，14B型号和Qwen2.5-Turbo在查找非常长的文档中的隐藏数字时都达到了完美的准确性。较小的7B型号也表现良好，只有轻微的错误。

在RULER、LV-Eval和LongbenchChat等要求更高的复杂的上下文测试中，百万token模型的表现优于128K token模型，尤其是在超过64K token的序列中，14B型号甚至在RULER中得分超过90分——这是Qwen系列的第一次——在多个数据集上持续击败gpt - 4o mini。

是时候整体重估中国AI资产了吗？

如果说DeepSeek V3的横空出世展现了中国AI的锐度，那么本次阿里的突破则体现了产业生态的深度进化。

在Qwen2.5-Max发布当天，阿里云百炼平台同步开放了完整的工具链支持，开发者可以直接在云端调用。这种"超算集群+开源生态+云原生"的三位一体架构，与北美AWS、Azure、GCP三大云服务商的商业模式形成镜像。

此外，根据我们之前提到的摩根士丹利最新研报，低成本高性能模型也将重塑数据中心和软件行业格局：

对于中国数据中心而言，短期内，如果大型科技公司采用类似技术路线，可能减少AI训练相关需求。但从长远来看，低成本模型将推动推理需求增长，对一线城市数据中心形成利好；
对于中国软件行业，AI模型成本的降低将降低应用程序运行AI功能的门槛，从供给侧改善行业环境。

如果阿里Qwen-2.5-max的性能确实展现出预期水平，加之其低成本优势与完整云生态，或引发DeepSeek之后的中国AI资产新一轮重估。

富途5x24小時美股交易，方便隨時彈入彈出，快來體驗吧>>

编辑/danial

當阿里雲展現出"強大模型+充足算力+完整雲平台"的組合優勢時，是否印證了類似去年北美雲計算服務商的投資邏輯？

農曆除夕夜，在全球華人喜迎新春之時，紐約證券交易所的電子屏上，$阿里巴巴 (BABA.US)$美股股價在收盤前出現顯著異動——從漲幅1%快速拉升至6.7%。

行情異動的背後，是一場沒有硝煙的技術奇襲。

1月29日凌晨，阿里通義千問團隊悄然上線的大模型Qwen2.5-Max，在多個權威基準測試中展現出與全球頂級模型比肩的性能。

繼DeepSeek之後，Qwen2.5-Max的發佈是中國AI陣營在高性能、低成本技術路線上的又一重要突破。

市場人士分析稱，此前過度聚焦DeepSeek，卻忽視了包括阿里通義在內的中國AI整體性追趕。行業媒體《信息平權》表示，若阿里Qwen-2.5-max這次的確性能超過V3，可以對其RL推理模型給予更大期待。

進一步，當阿里雲展現出"強大模型+充足算力+完整雲平台"的組合優勢時，是否印證了類似去年北美雲計算服務商的投資邏輯？如果美股因AI整體增值10萬億美元，中國AI資產的重估時機是否已至？

全面對標全球頂級模型，百萬token里程碑

Qwen2.5-Max採用超大規模MoE（混合專家）架構，基於超過20萬億token的預訓練數據。

在測試大學水平知識的MMLU-Pro、評估編程能力的LiveCodeBench、綜合能力評估的LiveBench，以及近似人類偏好的Arena-Hard等多個權威評測中，該模型均展現出與DeepSeek V3、GPT-4和Claude-3.5-Sonnet比肩，甚至領先的性能。

阿里團隊表示，隨着後訓練技術的不斷進步，下一個版本將有望達到更高水平。

Qwen2.5團隊同步發佈了兩個創新型號：Qwen2.5-7b-instruct-1m和Qwen2.5-14b-instruct-1m。這些開源模型支持高達100萬token的上下文窗口，成爲業內首個達到此規模的公開可用模型。

這些模型使用稀疏注意力，只關注上下文中最重要的部分。這種方法處理百萬token輸入的速度比傳統方法快3到7倍，輸出長度可達8000個token。然而，這需要模型識別上下文文檔中的關鍵段落——這是當前語言模型經常難以完成的任務。

在測試中，14B型號和Qwen2.5-Turbo在查找非常長的文檔中的隱藏數字時都達到了完美的準確性。較小的7B型號也表現良好，只有輕微的錯誤。

在RULER、LV-Eval和LongbenchChat等要求更高的複雜的上下文測試中，百萬token模型的表現優於128K token模型，尤其是在超過64K token的序列中，14B型號甚至在RULER中得分超過90分——這是Qwen系列的第一次——在多個數據集上持續擊敗gpt - 4o mini。