share_log

阿里發佈具身智能大腦基礎模型RynnBrain,劍指深度環境理解力

華爾街見聞 ·  02/10 18:42

引入了時空記憶和物理世界推理兩項核心能力。

作者 | 黃昱

具身智能領域那堵長期存在的「智力高牆」,正在被一點點打破。

2月10日,阿里巴巴達摩院正式發佈具身智能大腦基礎模型 RynnBrain,並一次性開源了包括業界首個 30B MoE(混合專家模型)架構在內的 7 個全系列模型。

這一動作具有一定的里程碑意義。據介紹,RynnBrain首次讓機器人擁有了時空記憶和空間推理能力,同時在16項具身開源評測榜單上刷新紀錄(SOTA),超越 $谷歌-C (GOOG.US)$ Gemini Robotics ER 1.5等行業頂尖模型。

這意味着,具身智能長期面臨的「時空遺忘」與「物理幻覺」枷鎖正被努力解開,機器人大腦有望從簡單的指令接收器進化爲具備深度環境理解能力的智能實體。

長期以來,具身模型的智能水平已成爲制約機器人走向通用化的重要瓶頸,尤其是泛化能力的短板極大地限制了其在複雜物理場景中的應用。

爲了突破這一瓶頸,業界形成了多條技術探索路線。

據華爾街見聞了解,一類是側重於動作輸出的 VLA 模型,雖然能直接操作物理世界,但由於高質量機器數據稀缺,極難實現跨場景的泛化;另一類則是引入具備泛化潛力的 VLM 等大腦模型,但這類模型普遍缺乏記憶能力,動態認知受限,且普遍存在物理幻覺,難以支持人形機器人複雜的移動操作。

這種由於智力架構缺陷導致的技術高牆,使得即便看似先進的機器人,在面對複雜的移動操作時依然顯得力不從心。

阿里達摩院的 RynnBrain 模型正是爲了從底層邏輯上推倒這堵牆而生。

據悉,RynnBrain創造性地引入了時空記憶和物理世界推理兩項核心能力,這是機器人與環境深度互動所需的兩項基本能力。

所謂時空記憶,是指機器人能夠在完整的歷史記憶中定位物體、回溯目標區域,甚至預測運動軌跡,從而賦予了機器人全局的時空回溯能力。

物理空間推理則不同於傳統的純文本推理範式,RynnBrain 採用文本與空間定位交錯進行的推理策略,確保其推理過程緊密扎根於物理環境,大大減弱了幻覺問題。

舉例來說,運行 RynnBrain 的機器人在執行任務 A 時若被突然打斷要求先做任務 B,它能精準地記住任務 A 的時間與空間狀態,待任務 B 完成後再無縫接續工作。這種「長腦子」的記憶機制,解決了具身智能領域長期存在的「瞬時失憶」難題。

此外,據華爾街見聞了解,RynnBrain在 Qwen3-VL 的基礎上訓練,並採用了達摩院自研的 RynnScale 架構進行深度優化,在同等算力資源下實現了兩倍的訓練加速,訓練數據量更是超過了2000 萬對。

這種高效的訓練體系直接體現在了評測成績上:在包括環境感知、對象推理、第一人稱視覺問答、空間推理、軌跡預測等在內的 16 項關鍵任務中,RynnBrain 全方位刷新了行業紀錄。這不僅是算力的堆砌,更是對具身智能底層架構的一次成功重構。

據悉,RynnBrain還擁有良好的可拓展性,能夠快速後訓練出導航、規劃、動作等多種具身模型,有望成爲具身行業的基礎模型。

在想要打造具身智能行業基礎模型的道路上,達摩院也選擇了開源這一條路線。

據悉,達摩院此次開源了RynnBrain全系列模型,共計7個,包含全尺寸基礎模型與後訓練專有模型,其中有業界首個MoE架構的30B具身模型,只需要3B的推理激活參數就能超越業界的72B模型效果,因此能讓機器人動作更快、更絲滑。

同時,達摩院還開源了全新評測基準 RynnBrain-Bench,用於評測時空細粒度具身任務,填補了行業空白。

阿里達摩院此番大規模開源的背後,顯然有着更爲宏大的行業雄心,那就是要加速構建一個開放、可進化的具身智能生態。

站在全球科技競爭的視角看,具身智能正處於從「數字虛擬」向「物理實體」跨越的關鍵拐點。

達摩院具身智能實驗室負責人趙德麗指出,RynnBrain首次實現了大腦對物理世界的深度理解與可靠規劃,爲大小腦分層架構下的通用具身智能邁出關鍵一步。「我們期待它加速 AI 從數字世界走向真實物理場景的落地進程。」

2017年,阿里巴巴成立18年之際,馬雲創辦了達摩院,致力於解決促進生產力的科技、研發等問題,彼時螞蟻集團還承諾將在三年內對達摩院投入 1000 億元。

不過近三年來,在阿里集團組織大變革的背景下,達摩院也經歷了一次次的調整和洗牌,過去豐富的「4+X」研究領域,如今僅留下了「智能+計算」,智能方向包含醫療 AI、決策智能、視頻技術、具身智能、基因智能等,計算方向包含計算技術、RISC-V 等。

具身智能顯然是達摩院如今重點投入的方向之一。

據了解,在具身智能上,達摩院正在構建可部署、可擴展、可進化的具身智能系統,已開源了融合世界模型和VLA模型的WorldVLA、世界理解模型 RynnEC等具身模型,以及業界首個機器人上下文協議 RynnRCP。

在達摩院聚焦具身智能的同時,全球人形機器人市場也進入規模化發展的關鍵節點。2025 年,全球人形機器人市場迎來了規模化起點。

IDC數據顯示,去年全年全球人形機器人出貨量接近1.8萬台,同比增長約508%,銷售額約4.4億美元;同期,累計銷售訂單量預計超過3.5萬台。

雖然當前這一領域仍面臨着真實物理反饋數據稀缺、非結構化環境泛化以及軟硬件深度協同等諸多挑戰,但RynnBrain 的開源無疑爲全球開發者提供了一套相對成熟的「大腦模板」,有助於具身智能產業化的加速落地。

對於行業而言,這不僅是一次代碼的釋放,更是一次技術權力的重新分配。當頂尖模型不再是巨頭實驗室裏的祕密武器,具身智能產業將進入一個加速迭代、群體進化的新週期。

編輯/doris

譯文內容由第三人軟體翻譯。


以上內容僅用作資訊或教育之目的,不構成與富途相關的任何投資建議。富途竭力但無法保證上述全部內容的真實性、準確性和原創性。
    搶先評論