聚焦港美股

專題 13303條資訊 107094人訂閱

業界首次！騰訊發佈能秒回的深度思考模型

證券時報 · 03/22 06:59

来源：证券时报

继快思考模型Turbo S后，腾讯又推出了自研深度思考模型混元T1正式版。据介绍，这是一款“能秒回”的强推理模型，也是工业界首次将混合Mamba架构无损应用于超大型推理模型。

3月21日深夜，腾讯混元大模型团队正式推出了自研深度思考模型混元T1正式版。该模型具有效果好、速度快的特点，多项指标达到业界领先推理水平，吐字速度达到每秒60—80tokens，在实际生成效果表现中远快于DeepSeek-R1推理模型。

能秒回的深度思考模型

目前，用户在使用DeepSeek-R1等推理模型时，由于模型需要进行深度思考，并在提供回答前列出详细的思维链，虽然能够体现较高的智能化水平，但存在响应速度慢、不够高效的短板。

混元T1正式版则致力于解决这一问题，不仅吐字快、能秒回，还擅长超长文处理。在体现推理模型基础能力的常见基准测试上，如大语言模型评估增强数据集MMLU-PRO中，混元T1取得87.2分，超越了DeepSeek-R1，仅次于o1。

值得注意的是，混元T1正式版沿用了混元Turbo S的创新架构，采用Hybrid-Mamba-Transformer融合模式。这一架构有效降低了传统Transformer结构的计算复杂度，减少了KV-Cache的内存占用，从而显著降低了训练和推理成本。

这也意味着，腾讯摒弃了传统及主流的纯Transformer架构，首次将混合Mamba架构无损应用于超大型推理模型。

目前，混元T1已在腾讯云官网上线。价格方面，输入价格为1元/每百万tokens，输出价格为4元/每百万tokens，输出价格为DeepSeek标准时段的1/4，与DeepSeek优惠时段一致。

腾讯大模型业务动作频频

作为大模型的“后发者”，腾讯今年以来动作频频，不仅快速地将旗下十余款产品接入了DeepSeek，自研的混元模型系列也进入快速迭代期。同时，腾讯也在加大对C端产品元宝的投入，积极抢占大模型用户入口。

腾讯3月19日发布的最新财报显示，腾讯2024年全年实现营收6603亿元，同比增长8%;净利润为1940.7亿元，比上年增长68%。腾讯董事会主席兼首席执行官马化腾在业绩会上表示，在过去一两个月里，AI得到了很大发展，尤其是在DeepSeek横空出世后，腾讯在云业务、“元宝”(AI应用)上都积极拥抱DeepSeek。

据腾讯官方微信号发布，自今年2月来，腾讯元宝接入DeepSeek满血版和全新混元模型，双核驱动元宝高速进化、日更级迭代，35天版本已经更新30次。除此以外，目前腾讯已有元宝、微信、腾讯文档、QQ浏览器、QQ音乐、微信读书等数十款产品及业务接入DeepSeek。

业内人士分析，作为拥有强大生态和用户基础的公司，腾讯如今通过走混元模型+DeepSeek模型结合的路径，致力于在AI应用领域构建起自身的竞争优势。

马化腾在业绩会上还表示：“数月前，我们重组了AI团队以聚焦于快速的产品创新及深度的模型研发，增加了AI相关的资本开支，并加大了我们对原生AI产品的研发和营销力度。我们相信这些增加的投资，会通过提升广告业务的效率及游戏的生命周期而带来持续的回报，并随着我们个人AI应用的加速普及和更多企业采用我们的AI服务，创造更长远的价值。”

财报显示，2024年第四季度，腾讯资本开支同比增长386%至365.8亿元，2024年全年资本开支达到767.6亿元，同比增长221%，创历史新高，占总营收的11.6%。研发投入方面，2024年全年的AI研发投入达到706.9亿元，2018年至今累计投入3403亿元。腾讯总裁刘炽平表示，第四季度的资本支出增加非常显著，这是由于这一季度公司购买了更多GPU以满足推理需求，计划在2025年进一步增加资本支出。

编辑/jayden

來源：證券時報

繼快思考模型Turbo S後，騰訊又推出了自研深度思考模型混元T1正式版。據介紹，這是一款「能秒回」的強推理模型，也是工業界首次將混合Mamba架構無損應用於超大型推理模型。

3月21日深夜，騰訊混元大模型團隊正式推出了自研深度思考模型混元T1正式版。該模型具有效果好、速度快的特點，多項指標達到業界領先推理水平，吐字速度達到每秒60—80tokens，在實際生成效果表現中遠快於DeepSeek-R1推理模型。

能秒回的深度思考模型

目前，用戶在使用DeepSeek-R1等推理模型時，由於模型需要進行深度思考，並在提供回答前列出詳細的思維鏈，雖然能夠體現較高的智能化水平，但存在響應速度慢、不夠高效的短板。

混元T1正式版則致力於解決這一問題，不僅吐字快、能秒回，還擅長超長文處理。在體現推理模型基礎能力的常見基準測試上，如大語言模型評估增強數據集MMLU-PRO中，混元T1取得87.2分，超越了DeepSeek-R1，僅次於o1。

值得注意的是，混元T1正式版沿用了混元Turbo S的創新架構，採用Hybrid-Mamba-Transformer融合模式。這一架構有效降低了傳統Transformer結構的計算複雜度，減少了KV-Cache的內存佔用，從而顯著降低了訓練和推理成本。

這也意味着，騰訊摒棄了傳統及主流的純Transformer架構，首次將混合Mamba架構無損應用於超大型推理模型。

目前，混元T1已在騰訊雲官網上線。價格方面，輸入價格爲1元/每百萬tokens，輸出價格爲4元/每百萬tokens，輸出價格爲DeepSeek標準時段的1/4，與DeepSeek優惠時段一致。

騰訊大模型業務動作頻頻

作爲大模型的「後發者」，騰訊今年以來動作頻頻，不僅快速地將旗下十餘款產品接入了DeepSeek，自研的混元模型系列也進入快速迭代期。同時，騰訊也在加大對C端產品元寶的投入，積極搶佔大模型用戶入口。

騰訊3月19日發佈的最新業績顯示，騰訊2024年全年實現營收6603億元，同比增長8%;凈利潤爲1940.7億元，比上年增長68%。騰訊董事會主席兼首席執行官馬化騰在業績發佈會上表示，在過去一兩個月裏，AI得到了很大發展，尤其是在DeepSeek橫空出世後，騰訊在雲業務、「元寶」(AI應用)上都積極擁抱DeepSeek。

據騰訊官方微信號發佈，自今年2月來，騰訊元寶接入DeepSeek滿血版和全新混元模型，雙核驅動元寶高速進化、日更級迭代，35天版本已經更新30次。除此以外，目前騰訊已有元寶、微信、騰訊文檔、QQ瀏覽器、QQ音樂、微信讀書等數十款產品及業務接入DeepSeek。

業內人士分析，作爲擁有強大生態和用戶基礎的公司，騰訊如今通過走混元模型+DeepSeek模型結合的路徑，致力於在AI應用領域構建起自身的競爭優勢。

馬化騰在業績發佈會上還表示：「數月前，我們重組了AI團隊以聚焦於快速的產品創新及深度的模型研發，增加了AI相關的資本開支，並加大了我們對原生AI產品的研發和營銷力度。我們相信這些增加的投資，會通過提升廣告業務的效率及遊戲的生命週期而帶來持續的回報，並隨着我們個人AI應用的加速普及和更多企業採用我們的AI服務，創造更長遠的價值。」

業績顯示，2024年第四季度，騰訊資本開支同比增長386%至365.8億元，2024年全年資本開支達到767.6億元，同比增長221%，創歷史新高，佔總營收的11.6%。研發投入方面，2024年全年的AI研發投入達到706.9億元，2018年至今累計投入3403億元。騰訊總裁劉熾平表示，第四季度的資本支出增加非常顯著，這是由於這一季度公司購買了更多GPU以滿足推理需求，計劃在2025年進一步增加資本支出。

編輯/jayden

譯文內容由第三人軟體翻譯。

以上內容僅用作資訊或教育之目的，不構成與富途相關的任何投資建議。富途竭力但無法保證上述全部內容的真實性、準確性和原創性。

讚好

評論 2 · 瀏覽 2.7萬

評論(2)

熱點推薦

寫評論

2 5

熱門討論

地產板塊回暖！中國資產能否延續漲勢？

3月17日早盤，地產代理、物業服務及管理等板塊漲幅明顯，貝殼-W早盤漲逾4%，碧桂園服務漲逾9%。政策消息面上，兩部門發文落實專項債支持收地，中房協組織民營房企座談會。中國資產本輪火爆行情還能持續多久？你會如何投資？展开

北水狂掃港股！近期如何操作？

71%

29%

看好！繼續加倉

我恐高，逢高減倉

1.6萬人參與

年頭旺到年尾

02/27 16:09

2月27日覆盤..

$恒生指數 (800000.HK)$ $恒指當月期貨 (HSIcurrent.HK)$ 前天覆盤提到估計前頂23700不是頂，昨日就即時升破了，而且升幅有最高接近1千點有點意外，因為短線炒即市低估了升幅，所以也多手曾入了熊，最后收盤時熊仔止蝕離場

，而今天在早盤衝高至24000附近入了熊仔后，指數大幅下跌最多接近6百多點，即時把昨日虧損賺回有突多

，而今天再破新高，最高 24076 ，其後收市時轉跌約70點，出了陰燭，暫時走勢仍未有破壞，不過由前底至今已經上漲接近至6千點，本人覺得有貨者可以繼續持貨直到明顯有走勢轉壞才止賺離場，沒貨者可以等待回調后再上車，其實本人也希望能夠快點有回調，一來可以上車，二來回一回氣也健康

，暫時看法都是跟之前一樣，覺得即使有所回調應該都不會跌得太深，但假若期貨失守22350企不穩收，便可能還有下跌空間，期貨短期要跌破21400的機會應該也不大，所以本人覺得如果有大幅的回調也是一個機會分注做多。近日都堅持不過夜持倉，暫只做即市，因為不高追，也不隨便做空。
支持阻力以現貨作參考
支持位 23150，23250，2...

聚焦港美股

业界首次！腾讯发布能秒回的深度思考模型

業界首次！騰訊發佈能秒回的深度思考模型

能秒回的深度思考模型

腾讯大模型业务动作频频

能秒回的深度思考模型

騰訊大模型業務動作頻頻

風險及免責聲明

聲明