特斯拉FSD 12直播首秀！45分鐘僅一次干預，視頻「喂」出AI「代駕」

財聯社 · 2023/08/28 20:26

来源：财联社

①在非预设道路上，车辆能自行礼让行人、避开路障、路口转向、在两条直行道中选择一条车少的。

②通过视频训练数据，AI可以自己学习驾驶；来自优秀驾驶员的高质量数据，是训练特斯拉自动驾驶的关键。

③特斯拉即将上线一个新算力集群，其中包含1万颗英伟达H100。

正如之前承诺的一样，马斯克上周末用一辆搭载HW3的Model S，向外界直播展示了特斯拉FSD 12测试版。

在这场45分钟的直播中，坐在方向盘后、举着手机的马斯克仅干预了一次车辆行为，车辆在非预设道路上，便能自行礼让行人、避开路障、路口转向、在两条直行道中选择一条车少的。

马斯克表示，FSD 12可以在不熟悉的环境中离线使用；若有干预行为发生，系统会记录并发回特斯拉分析。

而在直播开始后约20分钟时，马斯克进行了全程唯一一次干预接管。当时，这辆Model S需要直行，因此停下等待红灯。但当左转信号灯转绿时，车辆竟然也紧跟启动，好在马斯克与一旁的工程师及时制止。

在这之后，马斯克表示，要给FSD“投喂”更多左转红绿灯的视频。

投喂视频就能“喂”出“AI代驾”？

实际上，在这场直播中，当车辆自行在减速带减速、避开滑板车骑行者时，马斯克多次强调，FSD 12中没有任何一行相应代码，人为设定车辆作出这些动作——其没有被训练过如何读取路标，也不知道什么是滑板车，FSD 12完成这些行为完全是大量视频训练的结果。通过视频训练数据，AI可以自己学习驾驶，“像人类一样做事”。

如果FSD在特定场景下没有作出正确决策，特斯拉便会向其神经网络训练投入更多数据（主要是视频）。

当然，平庸随意的数据是不够的，供给神经网络的数据需要精心挑选。马斯克也特别强调，来自优秀驾驶员的高质量数据，才是训练特斯拉自动驾驶的关键。

“大量平庸的数据并不能改善驾驶，数据管理相当困难。我们有很多软件，可以控制系统选择什么数据、训练什么数据。”

而对特斯拉而言，其数据的一大主要来源便是来自全球各地的车队。马斯克还透露，特斯拉在世界各地拥有多名FSD测试驾驶员，包括新西兰、泰国、挪威、日本等。

从2020年起，特斯拉便开始将Autopilot决策从编程逻辑转向神经网络与AI。经过3年的发展，从本次马斯克的FSD 12直播也能看到，几乎整个决策与场景处理已转移至特斯拉神经网络与AI上。

FSD 11独占控制堆栈中有超过30万行C++代码，而12中代码寥寥。之前马斯克也曾指出，车辆控制（vehicle control）是“特斯拉FSD AI拼图”上的最后一块拼图，其将使得这30万行以上的C++代码减少约2个数量级。

全AI端到端驾驶控制

特斯拉FSD 12是其最重要的一次升级，实现了全AI端到端的驾驶控制。

至于为何选择端到端方案？马斯克直播之前与WholeMars连线时，给出了更多细节。

“人类就是这么做的，”他表示，“光子输入，手脚动作（控制）输出。”——人类依靠眼睛和生物神经网络开车，对于自动驾驶而言，摄像头与神经网络AI便是正确的通用决策方案。

虽说AI神经网络难以解释具体细节，但相应地，人类乘客在打车时，也无法准确地知道司机在想什么，只能看到司机的评价。

券商指出，端到端方案与之前的关键区别之一就在于，传统的模块化架构是将智能驾驶拆分称单独任务，交由专门的AI模型或模块来处理，例如感知、预测、规划等；而端到端AI则是“感知决策一体化”，即将“感知”与“决策”融合到一个模型中。

目前，特斯拉绝大多数训练还是需要依靠英伟达的GPU，特斯拉自家的Dojo超算则是作为辅助。今年以来，特斯拉已为训练花费了20亿美元。

特斯拉还正在加班加点，筹备一个新算力集群，其中包含1万颗英伟达H100，有望在本周一（8月28日）上线。值得一提的是，该集群使用的是Infiniband进行连接传输，马斯克更坦言，如今Infiniband比GPU更缺。

编辑/lambor

來源：財聯社

①在非預設道路上，車輛能自行禮讓行人、避開路障、路口轉向、在兩條直行道中選擇一條車少的。

②通過視頻訓練數據，AI可以自己學習駕駛；來自優秀駕駛員的高質量數據，是訓練特斯拉自動駕駛的關鍵。

③特斯拉即將上線一個新算力集羣，其中包含1萬顆英偉達H100。

正如之前承諾的一樣，馬斯克上週末用一輛搭載HW3的Model S，向外界直播展示了特斯拉FSD 12測試版。

在這場45分鐘的直播中，坐在方向盤後、舉着手機的馬斯克僅干預了一次車輛行爲，車輛在非預設道路上，便能自行禮讓行人、避開路障、路口轉向、在兩條直行道中選擇一條車少的。

馬斯克表示，FSD 12可以在不熟悉的環境中離線使用；若有干預行爲發生，系統會記錄併發回特斯拉分析。

而在直播開始後約20分鐘時，馬斯克進行了全程唯一一次干預接管。當時，這輛Model S需要直行，因此停下等待紅燈。但當左轉信號燈轉綠時，車輛竟然也緊跟啓動，好在馬斯克與一旁的工程師及時制止。

在這之後，馬斯克表示，要給FSD“投餵”更多左轉紅綠燈的視頻。

投餵視頻就能“喂”出“AI代駕”？

實際上，在這場直播中，當車輛自行在減速帶減速、避開滑板車騎行者時，馬斯克多次強調，FSD 12中沒有任何一行相應代碼，人爲設定車輛作出這些動作——其沒有被訓練過如何讀取路標，也不知道什麼是滑板車，FSD 12完成這些行爲完全是大量視頻訓練的結果。通過視頻訓練數據，AI可以自己學習駕駛，“像人類一樣做事”。

如果FSD在特定場景下沒有作出正確決策，特斯拉便會向其神經網絡訓練投入更多數據（主要是視頻）。

當然，平庸隨意的數據是不夠的，供給神經網絡的數據需要精心挑選。馬斯克也特別強調，來自優秀駕駛員的高質量數據，才是訓練特斯拉自動駕駛的關鍵。

“大量平庸的數據並不能改善駕駛，數據管理相當困難。我們有很多軟件，可以控制系統選擇什麼數據、訓練什麼數據。”

而對特斯拉而言，其數據的一大主要來源便是來自全球各地的車隊。馬斯克還透露，特斯拉在世界各地擁有多名FSD測試駕駛員，包括新西蘭、泰國、挪威、日本等。

從2020年起，特斯拉便開始將Autopilot決策從編程邏輯轉向神經網絡與AI。經過3年的發展，從本次馬斯克的FSD 12直播也能看到，幾乎整個決策與場景處理已轉移至特斯拉神經網絡與AI上。

FSD 11獨佔控制堆棧中有超過30萬行C++代碼，而12中代碼寥寥。之前馬斯克也曾指出，車輛控制（vehicle control）是“特斯拉FSD AI拼圖”上的最後一塊拼圖，其將使得這30萬行以上的C++代碼減少約2個數量級。

全AI端到端駕駛控制

特斯拉FSD 12是其最重要的一次升級，實現了全AI端到端的駕駛控制。

至於爲何選擇端到端方案？馬斯克直播之前與WholeMars連線時，給出了更多細節。

“人類就是這麼做的，”他表示，“光子輸入，手腳動作（控制）輸出。”——人類依靠眼睛和生物神經網絡開車，對於自動駕駛而言，攝像頭與神經網絡AI便是正確的通用決策方案。

雖說AI神經網絡難以解釋具體細節，但相應地，人類乘客在打車時，也無法準確地知道司機在想什麼，只能看到司機的評價。

券商指出，端到端方案與之前的關鍵區別之一就在於，傳統的模塊化架構是將智能駕駛拆分稱單獨任務，交由專門的AI模型或模塊來處理，例如感知、預測、規劃等；而端到端AI則是“感知決策一體化”，即將“感知”與“決策”融合到一個模型中。

目前，特斯拉絕大多數訓練還是需要依靠英偉達的GPU，特斯拉自家的Dojo超算則是作爲輔助。今年以來，特斯拉已爲訓練花費了20億美元。

特斯拉還正在加班加點，籌備一個新算力集羣，其中包含1萬顆英偉達H100，有望在本週一（8月28日）上線。值得一提的是，該集羣使用的是Infiniband進行連接傳輸，馬斯克更坦言，如今Infiniband比GPU更缺。

編輯/lambor

譯文內容由第三人軟體翻譯。

以上內容僅用作資訊或教育之目的，不構成與富途相關的任何投資建議。富途竭力但無法保證上述全部內容的真實性、準確性和原創性。

特斯拉FSD 12直播首秀！45分钟仅一次干预，视频「喂」出AI「代驾」

特斯拉FSD 12直播首秀！45分鐘僅一次干預，視頻「喂」出AI「代駕」

投喂视频就能“喂”出“AI代驾”？

全AI端到端驾驶控制

投餵視頻就能“喂”出“AI代駕”？

全AI端到端駕駛控制

風險及免責聲明

聲明