昆侖萬維開源R1V視覺思維鏈推理模型開啓多模態思考新時代

證券時報 · 03/18 10:48

3月18日，昆仑万维正式开源首款工业界多模态思维链推理模型Skywork R1V，即日起开源模型权重和技术报告。

继OpenAI o1和DeepSeek-R1在全球掀起长思考模型热潮后，大模型进入新技术范式。昆仑万维积极贡献开源社区，正式开源Skywork R1V多模态视觉推理模型，成为中国第一个开源“多模态推理模型”的企业。

据介绍，视觉推理模型是一类能够解决需要思维链(Chain-of-Thought)的视觉任务的模型，通过对视觉信息进行多步逻辑推理与分析，逐步推导出最终结果。这种模型不仅关注图像内容的识别与理解，更强调通过层层递进的推理路径，实现复杂视觉问题的精准求解，例如视觉逻辑推理、视觉数学问题、图像中的科学现象分析、医学影像的诊断推理等，从而有效拓展了视觉大模型的应用边界。

无论是日常繁琐的工作任务、复杂的数据分析、难以解答的学术问题，还是前所未见的陌生场景，都可以交给Skywork R1V进行高效处理。

在Reasoning推理能力方面，Skywork R1V实现了模型的顶尖逻辑推理与数学分析能力。在权威的MATH500和AIME基准测试中，Skywork R1V分别取得了94.0和72.0的高分，在纯文本复杂推理任务中展现出卓越性能，使其在逻辑推理和数学问题求解领域展现出人类专家级别的水准。

在Vision视觉理解能力方面，Skywork R1V成功地将其强大的文本推理与思维链推导能力高效迁移到视觉任务中。凭借创新的跨模态迁移技术与推理优化框架，Skywork R1V能够高效解决需要多步视觉推理的问题，在MMMU与MathVista等视觉推理基准中分别取得了69和67.5的优异成绩。

基于R1V模型，Skywork团队设计了一种灵活在R1V中扩展语音理解模态的方式，从而实现一个全模态思考大模型，该在单个模型中同时实现图像、视频、语音的全模态理解能力，并在语音和视觉理解评测中斩获多项SOTA成绩。未来公司将陆续公布测评成绩、开源全模态思考大模型。

2023年10月以来，昆仑万维陆续开源了百亿级大语言模型“天工”Skywork-13B系列、数字智能体全流程研发工具包AgentStudio、4000亿参数MoE超级模型、2千亿稀疏大模型Skywork-MoE、推理模型Skywork-o1-Open等。2025年2月18日，昆仑万维同时将SOTA级别的SkyReels-V1和SkyReels-A1进行开源。

在语言生成模型、AI Agent、推理模型、视频生成模型等相继开源、多点开花之后，公司正式开源Skywork R1V多模态推理模型，在文本-视觉多模态推理方向再下一城，成为中国第一家开源多模态思考模型的企业。昆仑万维表示,未来将持续开源优秀的模型、数据集等，共建开发者生态、加速技术创新、降低应用门槛、推动技术平权和AI行业发展。

3月18日，昆侖萬維正式開源首款工業界多模態思維鏈推理模型Skywork R1V，即日起開源模型權重和技術報告。

繼OpenAI o1和DeepSeek-R1在全球掀起長思考模型熱潮後，大模型進入新技術範式。昆侖萬維積極貢獻開源社區，正式開源Skywork R1V多模態視覺推理模型，成爲中國第一個開源「多模態推理模型」的企業。

據介紹，視覺推理模型是一類能夠解決需要思維鏈(Chain-of-Thought)的視覺任務的模型，通過對視覺信息進行多步邏輯推理與分析，逐步推導出最終結果。這種模型不僅關注圖像內容的識別與理解，更強調通過層層遞進的推理路徑，實現複雜視覺問題的精準求解，例如視覺邏輯推理、視覺數學問題、圖像中的科學現象分析、醫學影像的診斷推理等，從而有效拓展了視覺大模型的應用邊界。

無論是日常繁瑣的工作任務、複雜的數據分析、難以解答的學術問題，還是前所未見的陌生場景，都可以交給Skywork R1V進行高效處理。

在Reasoning推理能力方面，Skywork R1V實現了模型的頂尖邏輯推理與數學分析能力。在權威的MATH500和AIME基準測試中，Skywork R1V分別取得了94.0和72.0的高分，在純文本複雜推理任務中展現出卓越性能，使其在邏輯推理和數學問題求解領域展現出人類專家級別的水準。

在Vision視覺理解能力方面，Skywork R1V成功地將其強大的文本推理與思維鏈推導能力高效遷移到視覺任務中。憑藉創新的跨模態遷移技術與推理優化框架，Skywork R1V能夠高效解決需要多步視覺推理的問題，在MMMU與MathVista等視覺推理基準中分別取得了69和67.5的優異成績。

基於R1V模型，Skywork團隊設計了一種靈活在R1V中擴展語音理解模態的方式，從而實現一個全模態思考大模型，該在單個模型中同時實現圖像、視頻、語音的全模態理解能力，並在語音和視覺理解評測中斬獲多項SOTA成績。未來公司將陸續公佈測評成績、開源全模態思考大模型。

2023年10月以來，昆侖萬維陸續開源了百億級大語言模型「天工」Skywork-13B系列、數字智能體全流程研發工具包AgentStudio、4000億參數MoE超級模型、2千億稀疏大模型Skywork-MoE、推理模型Skywork-o1-Open等。2025年2月18日，昆侖萬維同時將SOTA級別的SkyReels-V1和SkyReels-A1進行開源。

在語言生成模型、AI Agent、推理模型、視頻生成模型等相繼開源、多點開花之後，公司正式開源Skywork R1V多模態推理模型，在文本-視覺多模態推理方向再下一城，成爲中國第一家開源多模態思考模型的企業。昆侖萬維表示,未來將持續開源優秀的模型、數據集等，共建開發者生態、加速技術創新、降低應用門檻、推動技術平權和AI行業發展。

譯文內容由第三人軟體翻譯。

以上內容僅用作資訊或教育之目的，不構成與富途相關的任何投資建議。富途竭力但無法保證上述全部內容的真實性、準確性和原創性。

讚好

熱點推薦

搶先評論

熱門討論

地產板塊回暖！中國資產能否延續漲勢？

3月17日早盤，地產代理、物業服務及管理等板塊漲幅明顯，貝殼-W早盤漲逾4%，碧桂園服務漲逾9%。政策消息面上，兩部門發文落實專項債支持收地，中房協組織民營房企座談會。中國資產本輪火爆行情還能持續多久？你會如何投資？展开

北水狂掃港股！近期如何操作？

71%

29%

看好！繼續加倉

我恐高，逢高減倉

1.6萬人參與

年頭旺到年尾

02/27 16:09

2月27日覆盤..

$恒生指數 (800000.HK)$ $恒指當月期貨 (HSIcurrent.HK)$ 前天覆盤提到估計前頂23700不是頂，昨日就即時升破了，而且升幅有最高接近1千點有點意外，因為短線炒即市低估了升幅，所以也多手曾入了熊，最后收盤時熊仔止蝕離場

，而今天在早盤衝高至24000附近入了熊仔后，指數大幅下跌最多接近6百多點，即時把昨日虧損賺回有突多

，而今天再破新高，最高 24076 ，其後收市時轉跌約70點，出了陰燭，暫時走勢仍未有破壞，不過由前底至今已經上漲接近至6千點，本人覺得有貨者可以繼續持貨直到明顯有走勢轉壞才止賺離場，沒貨者可以等待回調后再上車，其實本人也希望能夠快點有回調，一來可以上車，二來回一回氣也健康

，暫時看法都是跟之前一樣，覺得即使有所回調應該都不會跌得太深，但假若期貨失守22350企不穩收，便可能還有下跌空間，期貨短期要跌破21400的機會應該也不大，所以本人覺得如果有大幅的回調也是一個機會分注做多。近日都堅持不過夜持倉，暫只做即市，因為不高追，也不隨便做空。
支持阻力以現貨作參考
支持位 23150，23250，2...

昆仑万维开源R1V视觉思维链推理模型 开启多模态思考新时代

昆侖萬維開源R1V視覺思維鏈推理模型 開啓多模態思考新時代

風險及免責聲明

聲明

昆仑万维开源R1V视觉思维链推理模型开启多模态思考新时代

昆侖萬維開源R1V視覺思維鏈推理模型開啓多模態思考新時代