share_log

特斯拉FSD 12直播首秀!45分钟仅一次干预,视频「喂」出AI「代驾」

特斯拉FSD 12直播首秀!45分鐘僅一次干預,視頻「喂」出AI「代駕」

財聯社 ·  2023/08/28 20:26

來源:財聯社

①在非預設道路上,車輛能自行禮讓行人、避開路障、路口轉向、在兩條直行道中選擇一條車少的。

②通過視頻訓練數據,AI可以自己學習駕駛;來自優秀駕駛員的高質量數據,是訓練特斯拉自動駕駛的關鍵。

③特斯拉即將上線一個新算力集羣,其中包含1萬顆英偉達H100。

正如之前承諾的一樣,馬斯克上週末用一輛搭載HW3的Model S,向外界直播展示了特斯拉FSD 12測試版。

在這場45分鐘的直播中,坐在方向盤後、舉着手機的馬斯克僅干預了一次車輛行爲,車輛在非預設道路上,便能自行禮讓行人、避開路障、路口轉向、在兩條直行道中選擇一條車少的。

馬斯克表示,FSD 12可以在不熟悉的環境中離線使用;若有干預行爲發生,系統會記錄併發回特斯拉分析。

而在直播開始後約20分鐘時,馬斯克進行了全程唯一一次干預接管。當時,這輛Model S需要直行,因此停下等待紅燈。但當左轉信號燈轉綠時,車輛竟然也緊跟啓動,好在馬斯克與一旁的工程師及時制止。

在這之後,馬斯克表示,要給FSD“投餵”更多左轉紅綠燈的視頻。

投餵視頻就能“喂”出“AI代駕”?

實際上,在這場直播中,當車輛自行在減速帶減速、避開滑板車騎行者時,馬斯克多次強調,FSD 12中沒有任何一行相應代碼,人爲設定車輛作出這些動作——其沒有被訓練過如何讀取路標,也不知道什麼是滑板車,FSD 12完成這些行爲完全是大量視頻訓練的結果。通過視頻訓練數據,AI可以自己學習駕駛,“像人類一樣做事”。

如果FSD在特定場景下沒有作出正確決策,特斯拉便會向其神經網絡訓練投入更多數據(主要是視頻)。

當然,平庸隨意的數據是不夠的,供給神經網絡的數據需要精心挑選。馬斯克也特別強調,來自優秀駕駛員的高質量數據,才是訓練特斯拉自動駕駛的關鍵。

“大量平庸的數據並不能改善駕駛,數據管理相當困難。我們有很多軟件,可以控制系統選擇什麼數據、訓練什麼數據。”

而對特斯拉而言,其數據的一大主要來源便是來自全球各地的車隊。馬斯克還透露,特斯拉在世界各地擁有多名FSD測試駕駛員,包括新西蘭、泰國、挪威、日本等。

從2020年起,特斯拉便開始將Autopilot決策從編程邏輯轉向神經網絡與AI。經過3年的發展,從本次馬斯克的FSD 12直播也能看到,幾乎整個決策與場景處理已轉移至特斯拉神經網絡與AI上。

FSD 11獨佔控制堆棧中有超過30萬行C++代碼,而12中代碼寥寥。之前馬斯克也曾指出,車輛控制(vehicle control)是“特斯拉FSD AI拼圖”上的最後一塊拼圖,其將使得這30萬行以上的C++代碼減少約2個數量級。

全AI端到端駕駛控制

特斯拉FSD 12是其最重要的一次升級,實現了全AI端到端的駕駛控制。

至於爲何選擇端到端方案?馬斯克直播之前與WholeMars連線時,給出了更多細節。

“人類就是這麼做的,”他表示,“光子輸入,手腳動作(控制)輸出。”——人類依靠眼睛和生物神經網絡開車,對於自動駕駛而言,攝像頭與神經網絡AI便是正確的通用決策方案。

雖說AI神經網絡難以解釋具體細節,但相應地,人類乘客在打車時,也無法準確地知道司機在想什麼,只能看到司機的評價。

券商指出,端到端方案與之前的關鍵區別之一就在於,傳統的模塊化架構是將智能駕駛拆分稱單獨任務,交由專門的AI模型或模塊來處理,例如感知、預測、規劃等;而端到端AI則是“感知決策一體化”,即將“感知”與“決策”融合到一個模型中。

目前,特斯拉絕大多數訓練還是需要依靠英偉達的GPU,特斯拉自家的Dojo超算則是作爲輔助。今年以來,特斯拉已爲訓練花費了20億美元。

特斯拉還正在加班加點,籌備一個新算力集羣,其中包含1萬顆英偉達H100,有望在本週一(8月28日)上線。值得一提的是,該集羣使用的是Infiniband進行連接傳輸,馬斯克更坦言,如今Infiniband比GPU更缺。

編輯/lambor

譯文內容由第三人軟體翻譯。


以上內容僅用作資訊或教育之目的,不構成與富途相關的任何投資建議。富途竭力但無法保證上述全部內容的真實性、準確性和原創性。
    搶先評論