share_log

周末读物 | 智能驾驶的「GPT 时刻」,怎么就被特斯拉搞出来了?

週末讀物 | 智能駕駛的「GPT 時刻」,怎麼就被特斯拉搞出來了?

極客公園 ·  05/26 12:10

來源:極客公園 作者:周永亮

特斯拉FSD V12 走通了大數據、大模型、大算力,成爲徹頭徹尾的端到端學習。

5 月 15 日,針對$特斯拉 (TSLA.US)$FSD(Full-Self Driving,全自動駕駛)付費選裝率僅 2% 的消息,特斯拉 CEO 馬斯克在 X 平台上回複稱,實際情況遠遠超過了這個數字。

這一回應是針對知名特斯拉投資者加里·布萊克對未來 FSD 接受率的質疑而作。根據信用卡數據提供商 YipitData 提供的數據,在試用了一個月 FSD 的美國特斯拉車主中,只有 2% 的用戶選擇繼續訂閱該服務,遠低於預期的 6%。

布萊克認爲,這可能是因爲 FSD 服務的附加值不高,或者訂閱價格(每月 99 美元)過高。他呼籲特斯拉需認真評估這些因素,以更好地迎合車主需求。

與此同時,馬斯克 4 月底訪華,引發了關於特斯拉 FSD 在中國落地的討論。不過,據中國日報報道,儘管特斯拉提出在中國推出「無人駕駛出租車」,但中國政府尚未完全批准 FSD 在中國全面落地,可能會先支持其在國內進行測試和示範。

那麼,處於風口浪尖的特斯拉 FSD 實際體驗如何?是否會再次引發鯰魚效應?

01、智能駕駛的 ChatGPT 時刻

隨着新能源汽車進入智能化下半場,智能駕駛一直是行業追逐的技術制高點之一。人們不僅關注駕駛場景通過率和通勤效率,還更加關心智能駕駛是否更加人性化。

之前特斯拉 FSD 的 V11 版本,和很多智能駕駛系統一樣,速度控制生硬,處理突發情況時會突然剎車或加速,帶有明顯的機械感。尤其是在狹窄路段或惡劣天氣等特殊情況下,這種生硬的速度控制會讓用戶感到不安。

但現在,特斯拉 FSD V12 的出現改變了這一格局。體驗過特斯拉 FSD V12 的知乎博主「EatElephant」表示,它最大優勢之一是其擬人化的能力。V12 版本的最大提升在於速度和轉向控制的順暢度。乘客即使在後排坐着,也幾乎感覺不到在紅綠燈啓停和路口轉彎時的任何頓挫感。

第二,V12 在處理一些非結構化場景(比如缺少車道線與交通規則的約束)有了很大的提升,比如在轉彎的時機和幅度、減速的具體程度等方面。例如,在 V11 版本中,當車輛在直行時遇到前方遠處左轉的車輛時,智能駕駛系統的反應是明顯減速。雖然這樣可以規避碰撞風險,但減速的幅度通常過大,導致明顯的頓挫感,也增加了被後車追尾的風險。

而在 V12 版本中,面對類似情況,系統似乎能夠更準確地判斷前方車輛的行駛路線和速度。因此,它可以以非常合適的速度減緩,讓車上乘客幾乎感覺不到,同時又留出足夠的安全距離,避免了不必要的不舒適感和後方車輛的追尾風險。

第三,V12 應對各種場景的能力顯著提升,大大減少需要人工干預的次數。比如,特斯拉 FSD V12 不僅能夠識別並繞過路面上的鐵皮等障礙物,還能在道路施工時根據引導標識在臨時開闢的道路上行駛,就像人類司機一樣靈活應對。即使需要駛向對向車道,也能夠不受逆行標識和中心黃線的限制。在夜間行駛時,它能夠像人類一樣先右轉駛入兩輛靠邊的停車之間巧妙的避讓對向來車,待對向來車駛離後再向左打方向盤繼續前進,展現出了出色的駕駛技能。

試駕時的場景,藍色爲導航路線,綠色爲 V12 自主變動的路線 | 圖片來源:知乎博主「EatElephant」
試駕時的場景,藍色爲導航路線,綠色爲 V12 自主變動的路線 | 圖片來源:知乎博主「EatElephant」

同時,知乎博主「EatElephant」還提到,FSD V12 展示了一些類似智慧湧現的能力。在測試中,車輛遇到這樣一個難題:路口前有一個車道,V12 無法使用倒車檔完成掉頭。在乘客等待時,V12 發現了一個小停車場,果斷改變路線繞過,嘗試代替標準掉頭。儘管最後出口處系統提示接管,但這一行爲是自動駕駛技術中的一次重大突破,因爲通常系統會嚴格遵循導航路線,自行偏離導航的行爲幾乎不可接受。

這些進步也體現在人工干預的次數。相比之前版本,V12.3 版本在城市環境下的無關鍵接管行駛里程大幅增加,從約 100 多英里(約合 160 公里)提升到了 386.7 英里(約合 622 公里)

相比之下,同濟大學教授、汽車學院副院長熊璐曾表示,北京、上海、廣州等地的自動駕駛企業,平均每百公里需要接管 3.5 次到 10 次不等,基本上每行駛十幾或幾十公里就需要人工接管一次

目前,特斯拉 FSD 或許正迎來自己的「ChatGPT 時刻」,儘管仍存在一些不足之處。例如系統在駕駛時有時會讓人感覺距離路邊太近,讓人有些擔心;對來車的識別和避讓不夠及時,比如遇到消防車時的反應不夠靈敏;對一些特殊路標或車道的識別可能出現錯誤,對於坑窪的識別和避讓也有些問題。

不過,這並不妨礙特斯拉大幅增加對智能駕駛的投入。據了解,到今年年底,特斯拉計劃在自動駕駛技術上累計投入達到 100 億美元。考慮到 2016 年至 2023 年的總支出在 20 億美元左右,這意味着今年特斯拉在智能駕駛上的支出將達到 80 億美元左右。這是一筆巨額投資,表明特斯拉對進一步提升 FSD 技術的決心。

02、FSD V12 是如何煉成的?

特斯拉 FSD V12 的體驗顯著提升背後,是其技術路徑逐漸收斂的結果。

自從 2020 年推出 FSD 功能以來,特斯拉一直在引領智能駕駛技術發展方向。與傳統的依賴激光雷達和高精度地圖的方法不同,特斯拉堅持採用了純視覺技術,使得車輛能夠更好地理解周圍環境。

2022 年特斯拉 AI Day 上的佔據柵格技術框架 | 圖片來源:特斯拉
2022 年特斯拉 AI Day 上的佔據柵格技術框架 | 圖片來源:特斯拉

在隨後的兩年中,特斯拉通過一系列活動,如 AI Day 等,公佈了大量關於 FSD 技術的方案。這些方案涉及到數據閉環、共享主幹網絡、BEV 感知以及佔據網絡等概念。儘管這些技術處於行業領先地位,但之前的版本一直受到用戶詬病,認爲其用戶體驗改進不夠明顯。

然而,隨着 FSD 的發展到 V12 階段,情況發生了變化。與 FSD 11 相比,FSD V12 最大的變化在於採用了端對端神經網絡技術(End-to-End Neural Network, E2E NN)。這種技術使系統能夠更好地理解和處理複雜的駕駛環境,減少駕駛員的干預,提高了自動駕駛的精準度和自動化程度。

以往,FSD 的基本流程通常包括感知、決策和執行三個階段。在早期版本中,感知階段需要通過視覺或雷達獲取周圍物體信息,並對其進行識別和分類,而決策階段則依賴於預先編寫的控制規則。

特斯拉 FSD 車輛變道 | 圖片來源:特斯拉
特斯拉 FSD 車輛變道 | 圖片來源:特斯拉

然而,在 FSD V12 中,採用了端對端神經網絡技術,這些步驟發生了革命性的變化:感知階段不再需要手動識別和分類物體,決策階段也不再需要預先編寫的控制規則。系統只需要通過大量視頻輸入來讓神經網絡學習,就能夠在不同情況下做出正確的決策。這使得特斯拉在 FSD V12 中能夠減少大量代碼,使系統更加輕便、靈活,同時即使在沒有網絡連接的情況下,也能夠在陌生的環境中正常運行。

馬斯克去年底曾表示,特斯拉的 FSD Beta V12 從頭到尾沒有編程,沒有程序員寫一行代碼來識別道路、行人等概念,全部交給了神經網絡自己思考,C++代碼只有 2000 行,而 V11 有 30 萬行。

其實,端到端模型並不是一個新概念,早在之前就有人提出過。然而,許多人對神經網絡的可解釋性和可靠性一直存在疑慮。儘管端到端系統提高了模型的能力上限,但也放大了神經網絡作爲「黑盒」的不可解釋性問題,這會給研發迭代和問題解決帶來巨大挑戰。所以,很多公司不敢輕易嘗試。

特斯拉 FSD 讓大家看到端到端模型的潛力。當然,這個過程並不是一蹴而就的。特斯拉一直在自動駕駛技術中,強調端到端的「純度」。從 V10.9 版本開始,他們去掉了車道線感知的後處理代碼,改爲由模型直接輸出車道線。在 AI Day 上,特斯拉也展示瞭如何將學習型軌跡生成和神經網絡決策模型引入規劃控制模塊。

然而,特斯拉的技術更新主要集中在技術棧的中上游,如感知和預測,而控制行車功能的決策規劃模塊卻很少改變。這導致用戶體驗的改善不夠顯著。

V12 的重大突破在於打通了整個技術棧的最後一環(決策規劃),使系統能夠進行端到端數據驅動,最終實現了更自然、更智能的駕駛行爲。

隨着 V12 採用了端到端技術架構,直接優化了規劃控制輸出,因此用戶體驗的改善將會更加迅速。5 月初,馬斯克宣佈,特斯拉的 FSD 系統即將迎來三大更新版本,分別爲 V12.4、V12.5 和 V12.6。

其中,V12.4 版本預計將在 5 月中旬推出,該版本將全面更新模型訓練,以提高系統的準確性和可靠性。其次,針對用戶反饋的加速過猛和剎車過急問題,V12.4 以及後續版本將重點優化駕駛舒適度,從而提升乘客的駕乘體驗。

回到本文開頭,馬斯克造訪中國,似乎正在讓 FSD「落地中國」這件事變得更具可信性。甚至,外網盛傳比亞迪和特斯拉在 FSD 將展開合作的消息,更將 FSD 入華的潛力獲得更大的釋放——世界上最大的兩家新能源車公司的合作,會產生怎樣的結果?

如果傳言成真,特斯拉 FSD 是否會改變當前智能駕駛領域的局面?中國車企的智能駕駛「故事」又將如何繼續發展呢?

這大概是所有人都會幻想,卻不太敢問的問題。

編輯/lambor

譯文內容由第三人軟體翻譯。


以上內容僅用作資訊或教育之目的,不構成與富途相關的任何投資建議。富途竭力但無法保證上述全部內容的真實性、準確性和原創性。
    搶先評論