来源:极客公园 作者:周永亮
特斯拉FSD V12 走通了大数据、大模型、大算力,成为彻头彻尾的端到端学习。
5 月 15 日,针对$特斯拉 (TSLA.US)$ FSD(Full-Self Driving,全自动驾驶)付费选装率仅 2% 的消息,特斯拉 CEO 马斯克在 X 平台上回复称,实际情况远远超过了这个数字。
这一回应是针对知名特斯拉投资者加里·布莱克对未来 FSD 接受率的质疑而作。根据信用卡数据提供商 YipitData 提供的数据,在试用了一个月 FSD 的美国特斯拉车主中,只有 2% 的用户选择继续订阅该服务,远低于预期的 6%。
布莱克认为,这可能是因为 FSD 服务的附加值不高,或者订阅价格(每月 99 美元)过高。他呼吁特斯拉需认真评估这些因素,以更好地迎合车主需求。
与此同时,马斯克 4 月底访华,引发了关于特斯拉 FSD 在中国落地的讨论。不过,据中国日报报道,尽管特斯拉提出在中国推出「无人驾驶出租车」,但中国政府尚未完全批准 FSD 在中国全面落地,可能会先支持其在国内进行测试和示范。
那么,处于风口浪尖的特斯拉 FSD 实际体验如何?是否会再次引发鲶鱼效应?
01、智能驾驶的 ChatGPT 时刻 随着新能源汽车进入智能化下半场,智能驾驶一直是行业追逐的技术制高点之一。人们不仅关注驾驶场景通过率和通勤效率,还更加关心智能驾驶是否更加人性化。
之前特斯拉 FSD 的 V11 版本,和很多智能驾驶系统一样,速度控制生硬,处理突发情况时会突然刹车或加速,带有明显的机械感。尤其是在狭窄路段或恶劣天气等特殊情况下,这种生硬的速度控制会让用户感到不安。
但现在,特斯拉 FSD V12 的出现改变了这一格局。体验过特斯拉 FSD V12 的知乎博主「EatElephant」表示,它最大优势之一是其拟人化的能力。V12 版本的最大提升在于速度和转向控制的顺畅度。乘客即使在后排坐着,也几乎感觉不到在红绿灯启停和路口转弯时的任何顿挫感。
第二,V12 在处理一些非结构化场景(比如缺少车道线与交通规则的约束)有了很大的提升,比如在转弯的时机和幅度、减速的具体程度等方面。例如,在 V11 版本中,当车辆在直行时遇到前方远处左转的车辆时,智能驾驶系统的反应是明显减速。虽然这样可以规避碰撞风险,但减速的幅度通常过大,导致明显的顿挫感,也增加了被后车追尾的风险。
而在 V12 版本中,面对类似情况,系统似乎能够更准确地判断前方车辆的行驶路线和速度。因此,它可以以非常合适的速度减缓,让车上乘客几乎感觉不到,同时又留出足够的安全距离,避免了不必要的不舒适感和后方车辆的追尾风险。
第三,V12 应对各种场景的能力显著提升,大大减少需要人工干预的次数 。比如,特斯拉 FSD V12 不仅能够识别并绕过路面上的铁皮等障碍物,还能在道路施工时根据引导标识在临时开辟的道路上行驶,就像人类司机一样灵活应对。即使需要驶向对向车道,也能够不受逆行标识和中心黄线的限制。在夜间行驶时,它能够像人类一样先右转驶入两辆靠边的停车之间巧妙的避让对向来车,待对向来车驶离后再向左打方向盘继续前进,展现出了出色的驾驶技能。
试驾时的场景,蓝色为导航路线,绿色为 V12 自主变动的路线 | 图片来源:知乎博主「EatElephant」 同时,知乎博主「EatElephant」还提到,FSD V12 展示了一些类似智慧涌现的能力。在测试中,车辆遇到这样一个难题:路口前有一个车道,V12 无法使用倒车档完成掉头。在乘客等待时,V12 发现了一个小停车场,果断改变路线绕过,尝试代替标准掉头。尽管最后出口处系统提示接管,但这一行为是自动驾驶技术中的一次重大突破,因为通常系统会严格遵循导航路线,自行偏离导航的行为几乎不可接受。
这些进步也体现在人工干预的次数。相比之前版本,V12.3 版本在城市环境下的无关键接管行驶里程大幅增加,从约 100 多英里(约合 160 公里)提升到了 386.7 英里(约合 622 公里) 。
相比之下,同济大学教授、汽车学院副院长熊璐曾表示,北京、上海、广州等地的自动驾驶企业,平均每百公里需要接管 3.5 次到 10 次不等,基本上每行驶十几或几十公里就需要人工接管一次 。
目前,特斯拉 FSD 或许正迎来自己的「ChatGPT 时刻」,尽管仍存在一些不足之处。例如系统在驾驶时有时会让人感觉距离路边太近,让人有些担心;对来车的识别和避让不够及时,比如遇到消防车时的反应不够灵敏;对一些特殊路标或车道的识别可能出现错误,对于坑洼的识别和避让也有些问题。
不过,这并不妨碍特斯拉大幅增加对智能驾驶的投入。据了解,到今年年底,特斯拉计划在自动驾驶技术上累计投入达到 100 亿美元。考虑到 2016 年至 2023 年的总支出在 20 亿美元左右,这意味着今年特斯拉在智能驾驶上的支出将达到 80 亿美元左右。这是一笔巨额投资,表明特斯拉对进一步提升 FSD 技术的决心。
02、FSD V12 是如何炼成的? 特斯拉 FSD V12 的体验显著提升背后,是其技术路径逐渐收敛的结果。
自从 2020 年推出 FSD 功能以来,特斯拉一直在引领智能驾驶技术发展方向。与传统的依赖激光雷达和高精度地图的方法不同,特斯拉坚持采用了纯视觉技术,使得车辆能够更好地理解周围环境。
2022 年特斯拉 AI Day 上的占据栅格技术框架 | 图片来源:特斯拉 在随后的两年中,特斯拉通过一系列活动,如 AI Day 等,公布了大量关于 FSD 技术的方案。这些方案涉及到数据闭环、共享主干网络、BEV 感知以及占据网络等概念。尽管这些技术处于行业领先地位,但之前的版本一直受到用户诟病,认为其用户体验改进不够明显。
然而,随着 FSD 的发展到 V12 阶段,情况发生了变化。与 FSD 11 相比,FSD V12 最大的变化在于采用了端对端神经网络技术(End-to-End Neural Network, E2E NN)。这种技术使系统能够更好地理解和处理复杂的驾驶环境,减少驾驶员的干预,提高了自动驾驶的精准度和自动化程度。
以往,FSD 的基本流程通常包括感知、决策和执行三个阶段。在早期版本中,感知阶段需要通过视觉或雷达获取周围物体信息,并对其进行识别和分类,而决策阶段则依赖于预先编写的控制规则。
特斯拉 FSD 车辆变道 | 图片来源:特斯拉 然而,在 FSD V12 中,采用了端对端神经网络技术,这些步骤发生了革命性的变化:感知阶段不再需要手动识别和分类物体,决策阶段也不再需要预先编写的控制规则。系统只需要通过大量视频输入来让神经网络学习,就能够在不同情况下做出正确的决策。这使得特斯拉在 FSD V12 中能够减少大量代码,使系统更加轻便、灵活,同时即使在没有网络连接的情况下,也能够在陌生的环境中正常运行。
马斯克去年底曾表示,特斯拉的 FSD Beta V12 从头到尾没有编程 ,没有程序员写一行代码来识别道路、行人等概念,全部交给了神经网络自己思考,C++代码只有 2000 行,而 V11 有 30 万行。
其实,端到端模型并不是一个新概念,早在之前就有人提出过。然而,许多人对神经网络的可解释性和可靠性一直存在疑虑。尽管端到端系统提高了模型的能力上限,但也放大了神经网络作为「黑盒」的不可解释性问题,这会给研发迭代和问题解决带来巨大挑战 。所以,很多公司不敢轻易尝试。
特斯拉 FSD 让大家看到端到端模型的潜力。当然,这个过程并不是一蹴而就的。特斯拉一直在自动驾驶技术中,强调端到端的「纯度」。从 V10.9 版本开始,他们去掉了车道线感知的后处理代码,改为由模型直接输出车道线。在 AI Day 上,特斯拉也展示了如何将学习型轨迹生成和神经网络决策模型引入规划控制模块。
然而,特斯拉的技术更新主要集中在技术栈的中上游,如感知和预测,而控制行车功能的决策规划模块却很少改变。这导致用户体验的改善不够显著。
V12 的重大突破在于打通了整个技术栈的最后一环(决策规划),使系统能够进行端到端数据驱动,最终实现了更自然、更智能的驾驶行为。
随着 V12 采用了端到端技术架构,直接优化了规划控制输出,因此用户体验的改善将会更加迅速。5 月初,马斯克宣布,特斯拉的 FSD 系统即将迎来三大更新版本,分别为 V12.4、V12.5 和 V12.6。
其中,V12.4 版本预计将在 5 月中旬推出,该版本将全面更新模型训练,以提高系统的准确性和可靠性。其次,针对用户反馈的加速过猛和刹车过急问题,V12.4 以及后续版本将重点优化驾驶舒适度,从而提升乘客的驾乘体验。
回到本文开头,马斯克造访中国,似乎正在让 FSD「落地中国」这件事变得更具可信性。甚至,外网盛传比亚迪和特斯拉在 FSD 将展开合作的消息,更将 FSD 入华的潜力获得更大的释放——世界上最大的两家新能源车公司的合作,会产生怎样的结果?
如果传言成真,特斯拉 FSD 是否会改变当前智能驾驶领域的局面?中国车企的智能驾驶「故事」又将如何继续发展呢?
这大概是所有人都会幻想,却不太敢问的问题。
编辑/lambor
來源:極客公園 作者:周永亮
特斯拉FSD V12 走通了大數據、大模型、大算力,成爲徹頭徹尾的端到端學習。
5 月 15 日,針對$特斯拉 (TSLA.US)$ FSD(Full-Self Driving,全自動駕駛)付費選裝率僅 2% 的消息,特斯拉 CEO 馬斯克在 X 平台上回複稱,實際情況遠遠超過了這個數字。
這一回應是針對知名特斯拉投資者加里·布萊克對未來 FSD 接受率的質疑而作。根據信用卡數據提供商 YipitData 提供的數據,在試用了一個月 FSD 的美國特斯拉車主中,只有 2% 的用戶選擇繼續訂閱該服務,遠低於預期的 6%。
布萊克認爲,這可能是因爲 FSD 服務的附加值不高,或者訂閱價格(每月 99 美元)過高。他呼籲特斯拉需認真評估這些因素,以更好地迎合車主需求。
與此同時,馬斯克 4 月底訪華,引發了關於特斯拉 FSD 在中國落地的討論。不過,據中國日報報道,儘管特斯拉提出在中國推出「無人駕駛出租車」,但中國政府尚未完全批准 FSD 在中國全面落地,可能會先支持其在國內進行測試和示範。
那麼,處於風口浪尖的特斯拉 FSD 實際體驗如何?是否會再次引發鯰魚效應?
01、智能駕駛的 ChatGPT 時刻 隨着新能源汽車進入智能化下半場,智能駕駛一直是行業追逐的技術制高點之一。人們不僅關注駕駛場景通過率和通勤效率,還更加關心智能駕駛是否更加人性化。
之前特斯拉 FSD 的 V11 版本,和很多智能駕駛系統一樣,速度控制生硬,處理突發情況時會突然剎車或加速,帶有明顯的機械感。尤其是在狹窄路段或惡劣天氣等特殊情況下,這種生硬的速度控制會讓用戶感到不安。
但現在,特斯拉 FSD V12 的出現改變了這一格局。體驗過特斯拉 FSD V12 的知乎博主「EatElephant」表示,它最大優勢之一是其擬人化的能力。V12 版本的最大提升在於速度和轉向控制的順暢度。乘客即使在後排坐着,也幾乎感覺不到在紅綠燈啓停和路口轉彎時的任何頓挫感。
第二,V12 在處理一些非結構化場景(比如缺少車道線與交通規則的約束)有了很大的提升,比如在轉彎的時機和幅度、減速的具體程度等方面。例如,在 V11 版本中,當車輛在直行時遇到前方遠處左轉的車輛時,智能駕駛系統的反應是明顯減速。雖然這樣可以規避碰撞風險,但減速的幅度通常過大,導致明顯的頓挫感,也增加了被後車追尾的風險。
而在 V12 版本中,面對類似情況,系統似乎能夠更準確地判斷前方車輛的行駛路線和速度。因此,它可以以非常合適的速度減緩,讓車上乘客幾乎感覺不到,同時又留出足夠的安全距離,避免了不必要的不舒適感和後方車輛的追尾風險。
第三,V12 應對各種場景的能力顯著提升,大大減少需要人工干預的次數 。比如,特斯拉 FSD V12 不僅能夠識別並繞過路面上的鐵皮等障礙物,還能在道路施工時根據引導標識在臨時開闢的道路上行駛,就像人類司機一樣靈活應對。即使需要駛向對向車道,也能夠不受逆行標識和中心黃線的限制。在夜間行駛時,它能夠像人類一樣先右轉駛入兩輛靠邊的停車之間巧妙的避讓對向來車,待對向來車駛離後再向左打方向盤繼續前進,展現出了出色的駕駛技能。
試駕時的場景,藍色爲導航路線,綠色爲 V12 自主變動的路線 | 圖片來源:知乎博主「EatElephant」 同時,知乎博主「EatElephant」還提到,FSD V12 展示了一些類似智慧湧現的能力。在測試中,車輛遇到這樣一個難題:路口前有一個車道,V12 無法使用倒車檔完成掉頭。在乘客等待時,V12 發現了一個小停車場,果斷改變路線繞過,嘗試代替標準掉頭。儘管最後出口處系統提示接管,但這一行爲是自動駕駛技術中的一次重大突破,因爲通常系統會嚴格遵循導航路線,自行偏離導航的行爲幾乎不可接受。
這些進步也體現在人工干預的次數。相比之前版本,V12.3 版本在城市環境下的無關鍵接管行駛里程大幅增加,從約 100 多英里(約合 160 公里)提升到了 386.7 英里(約合 622 公里) 。
相比之下,同濟大學教授、汽車學院副院長熊璐曾表示,北京、上海、廣州等地的自動駕駛企業,平均每百公里需要接管 3.5 次到 10 次不等,基本上每行駛十幾或幾十公里就需要人工接管一次 。
目前,特斯拉 FSD 或許正迎來自己的「ChatGPT 時刻」,儘管仍存在一些不足之處。例如系統在駕駛時有時會讓人感覺距離路邊太近,讓人有些擔心;對來車的識別和避讓不夠及時,比如遇到消防車時的反應不夠靈敏;對一些特殊路標或車道的識別可能出現錯誤,對於坑窪的識別和避讓也有些問題。
不過,這並不妨礙特斯拉大幅增加對智能駕駛的投入。據了解,到今年年底,特斯拉計劃在自動駕駛技術上累計投入達到 100 億美元。考慮到 2016 年至 2023 年的總支出在 20 億美元左右,這意味着今年特斯拉在智能駕駛上的支出將達到 80 億美元左右。這是一筆巨額投資,表明特斯拉對進一步提升 FSD 技術的決心。
02、FSD V12 是如何煉成的? 特斯拉 FSD V12 的體驗顯著提升背後,是其技術路徑逐漸收斂的結果。
自從 2020 年推出 FSD 功能以來,特斯拉一直在引領智能駕駛技術發展方向。與傳統的依賴激光雷達和高精度地圖的方法不同,特斯拉堅持採用了純視覺技術,使得車輛能夠更好地理解周圍環境。
2022 年特斯拉 AI Day 上的佔據柵格技術框架 | 圖片來源:特斯拉 在隨後的兩年中,特斯拉通過一系列活動,如 AI Day 等,公佈了大量關於 FSD 技術的方案。這些方案涉及到數據閉環、共享主幹網絡、BEV 感知以及佔據網絡等概念。儘管這些技術處於行業領先地位,但之前的版本一直受到用戶詬病,認爲其用戶體驗改進不夠明顯。
然而,隨着 FSD 的發展到 V12 階段,情況發生了變化。與 FSD 11 相比,FSD V12 最大的變化在於採用了端對端神經網絡技術(End-to-End Neural Network, E2E NN)。這種技術使系統能夠更好地理解和處理複雜的駕駛環境,減少駕駛員的干預,提高了自動駕駛的精準度和自動化程度。
以往,FSD 的基本流程通常包括感知、決策和執行三個階段。在早期版本中,感知階段需要通過視覺或雷達獲取周圍物體信息,並對其進行識別和分類,而決策階段則依賴於預先編寫的控制規則。
特斯拉 FSD 車輛變道 | 圖片來源:特斯拉 然而,在 FSD V12 中,採用了端對端神經網絡技術,這些步驟發生了革命性的變化:感知階段不再需要手動識別和分類物體,決策階段也不再需要預先編寫的控制規則。系統只需要通過大量視頻輸入來讓神經網絡學習,就能夠在不同情況下做出正確的決策。這使得特斯拉在 FSD V12 中能夠減少大量代碼,使系統更加輕便、靈活,同時即使在沒有網絡連接的情況下,也能夠在陌生的環境中正常運行。
馬斯克去年底曾表示,特斯拉的 FSD Beta V12 從頭到尾沒有編程 ,沒有程序員寫一行代碼來識別道路、行人等概念,全部交給了神經網絡自己思考,C++代碼只有 2000 行,而 V11 有 30 萬行。
其實,端到端模型並不是一個新概念,早在之前就有人提出過。然而,許多人對神經網絡的可解釋性和可靠性一直存在疑慮。儘管端到端系統提高了模型的能力上限,但也放大了神經網絡作爲「黑盒」的不可解釋性問題,這會給研發迭代和問題解決帶來巨大挑戰 。所以,很多公司不敢輕易嘗試。
特斯拉 FSD 讓大家看到端到端模型的潛力。當然,這個過程並不是一蹴而就的。特斯拉一直在自動駕駛技術中,強調端到端的「純度」。從 V10.9 版本開始,他們去掉了車道線感知的後處理代碼,改爲由模型直接輸出車道線。在 AI Day 上,特斯拉也展示瞭如何將學習型軌跡生成和神經網絡決策模型引入規劃控制模塊。
然而,特斯拉的技術更新主要集中在技術棧的中上游,如感知和預測,而控制行車功能的決策規劃模塊卻很少改變。這導致用戶體驗的改善不夠顯著。
V12 的重大突破在於打通了整個技術棧的最後一環(決策規劃),使系統能夠進行端到端數據驅動,最終實現了更自然、更智能的駕駛行爲。
隨着 V12 採用了端到端技術架構,直接優化了規劃控制輸出,因此用戶體驗的改善將會更加迅速。5 月初,馬斯克宣佈,特斯拉的 FSD 系統即將迎來三大更新版本,分別爲 V12.4、V12.5 和 V12.6。
其中,V12.4 版本預計將在 5 月中旬推出,該版本將全面更新模型訓練,以提高系統的準確性和可靠性。其次,針對用戶反饋的加速過猛和剎車過急問題,V12.4 以及後續版本將重點優化駕駛舒適度,從而提升乘客的駕乘體驗。
回到本文開頭,馬斯克造訪中國,似乎正在讓 FSD「落地中國」這件事變得更具可信性。甚至,外網盛傳比亞迪和特斯拉在 FSD 將展開合作的消息,更將 FSD 入華的潛力獲得更大的釋放——世界上最大的兩家新能源車公司的合作,會產生怎樣的結果?
如果傳言成真,特斯拉 FSD 是否會改變當前智能駕駛領域的局面?中國車企的智能駕駛「故事」又將如何繼續發展呢?
這大概是所有人都會幻想,卻不太敢問的問題。
編輯/lambor