馬斯克：我信攝像頭，我要死磕到底

極客公園 · 2021/08/21 21:34

本文来自微信公众号：极客公园（ID：geekpark），作者：鱼三隹

北京时间 8 月 20 日上午，特斯拉 AI 日如期召开，正如其名字预示的那样，活动围绕着 AI 人工智能展开。与以往不同的是，这次活动特斯拉没有邀请媒体，也没有邀请投资人，只邀请了相关领域的工程师们，因此抛开商业化的问题之后，这次活动更像是一场针对技术方面的前瞻性汇报与演示。

AI 日上，特斯拉人工智能和自动驾驶视觉总监 Andrej Karpathy 详细介绍了特斯拉的「神经网络」，特斯拉众位高管也着重阐述了特斯拉在自动标记等技术上的进展，之前就备受关注的超级计算机 Dojo 也正式亮相了。

仔细观察不难发现，特斯拉 AI 日上介绍的所有技术似乎都隐隐传达着一个信号：即便越来越多的车企采用激光雷达技术实现自动驾驶，马斯克依旧要特立独行，势将「纯视觉路线」进行到底。

拥有超强算力的「道场」Dojo

五天前，特斯拉官方曾发布一张海报预热 AI 日活动。

海报上展示了一个大规模芯片模组的结构，包括芯片核心、铜板、散热器、金属外壳等组成元素，人们纷纷猜测这是否与特斯拉 AI 日上将公布的新产品有关。事实证明确实如此。

特斯拉 AI 日宣传海报｜特斯拉官网

这其实是一个集合了 25 块 D1 芯片的训练模块，而自研 AI 训练芯片 D1 可以说是 AI 日上最重磅的技术突破之一。

D1 芯片由特斯拉自主研发，7 纳米制造工艺，单片 FP32 达到算力 22.6TOPs，BF16 算力 362TOPs，这几乎是目前市面上最强的芯片。

而且 D1 芯片可以进行无缝融合，25 个 D1 芯片构成一个训练模块，更多的训练模块相互组合则构成了拥有更强大算力的超级计算机 Dojo。

Dojo 的名字不是第一次出现了，早在今年 6 月的 CVPR 2021 工坊活动上，Andrej Karpathy 就介绍过这台超级计算机，当时的 Dojo 搭载的还是英伟达的芯片，总算力为 1.8 EFLOPS，被认为可以跻身全球第五强超级计算机。

这次搭载了 D1 的 Dojo 亮相后，计算机博弈专家、芯片专家吴韧称赞这是「很精彩的设计」，甚至在朋友圈表示「如果 Elon 原意，或许这是 nVidia 最大的竞争者，实际上芯片巨头们的坐次可能需要重新排位。」

马斯克一直认为「解决自动驾驶的唯一方法是解决现实世界中的 AI 问题，无论是硬件还是软件，除非一家公司具有很强的 AI 能力以及超强算力，否则很难解决自动驾驶难题。」

因此特斯拉这次推出拥有强大算力的超级计算机 Dojo，其实也是出于解决自动驾驶问题的考量。与其他超算不同的是，这个被命名为「道场」的超算，其所有力量只用来做一件事儿：训练 Autopilot 在内的整个自动驾驶系统。

纯视觉路线

「道场」已经建好，受训的特斯拉 AI 神经网络更是关键。

特斯拉的神经网络主要用来处理物体识别和道路规划等功能所需的数据，这些是支持特斯拉 Autopilot/FSD 得到基础。

AI 日上，特斯拉 Autopilot 工程主管 Milan Kovac 向观众展示了特斯拉的 AI 神经网络究竟是怎样应用的。

特斯拉汽车的视觉组件｜特斯拉官网

在特斯拉的汽车中，每辆车装有 8 个摄像头，每个摄像头获取原始输入后能创建不同的分辨率，用于不同的功能和目的，最终这些信息会被输入到复杂的神经网络中，生成对自动驾驶有用的附加信息。

然而问题在于，即便拥有 8 个摄像头，其背后神经网络的矢量空间依旧不够。于是，特斯拉研发了自动标注技术，即便行驶过程中视野被遮挡，根据数据的标注，车辆也能更安全、准确的导航。

Andrej Karpathy 还称，现在特斯拉的自动驾驶场景模拟系统可以在行驶过程中实时绘制路况，结合多个车辆经过同一地点的绘制，得到一个完整的地图。

而这恰恰是特斯拉和 Waymo 等竞争对手最大的不同：基于类似人脑的视觉感知系统、自动化标注能力，以及仿真等功能，特斯拉在 Autopilot/FSD 上试图摆脱激光雷达，力图将「纯视觉」路线走得更加彻底。

这确实是马斯克一贯的坚持。

2019 年，马斯克一句「把激光雷达装在车上真的很蠢」，直接将自动驾驶技术路线一分为二，激起千层浪。

以特斯拉为代表的仅以摄像头与各种传感器作为硬件，背后重算法的路线，与 Waymo 为代表的注重激光雷达的技术路线，站在了对立面。

关于二者谁能走到最后，到今天也没有出现一个决定性的结论。

激光雷达，顾名思义是以激光作为信号源，由激光器发射出的脉冲激光打到周围物体上引起散射，一部分光波会反射到激光雷达的接收器上，根据激光测距原理计算，就得到从激光雷达到目标点的距离。激光不断扫描目标物，就可以得到全部数据，成像处理后，可得到精确的三维立体图像。

而在马斯克看来，「纯视觉感知才是通往真实世界 AI 的道路」，既然人类是通过视觉收集信息辅以大脑处理信息的方式进行驾驶，那自动驾驶也应当能通过视觉感知辅以算法处理的方式实现安全驾驶。

当外部环境越来越复杂，自动汽车上安装的传感器也越来越多，如果雷达与摄像头传来的信息互相矛盾，自动驾驶系统反而会更加难以抉择。

马斯克拒绝「拉扯」，他选择直接将摄像头的作用发挥到极致。

将「第一性原理」贯彻到底？

熟悉马斯克的人都知道他一直奉行「第一性原理」，即回归事物最基本的条件，将其拆分成各要素进行结构分析，从而找到实现目标的最优路径的方法。

目前「感知、判断驾驶环境」无疑是自动驾驶领域的核心困难，马斯克依旧回归到「感知」的基础，不遗余力地将 AI 进化到能与人类视觉感知媲美的地步。

马斯克认为，毫米波雷达不擅长描述物体的缺陷是几乎不可能弥补的，而摄像头不擅长探测距离的缺陷却是可以弥补的。为了「一步到位」，马斯克丝毫不考虑将激光雷达安装在特斯拉上。

事实上，特斯拉的「纯视觉路线」，需要更加深度地学习海量的数据，深度训练神经网络，这一点对于其他的自动汽车公司而言，绝不是敢轻易尝试的。马斯克能坚持下去，和其起步早、能积攒的数据多不无关系。

据高盛估计，目前特斯拉车队的数量在全球超过 150 万辆，这为特斯拉提供了大量、多样化和真实世界的数据库。这意味着，即便数据采集效率相同，跑在路上的特斯拉数量是对手的数十倍，数据量也就是竞争对手的数十倍。

再加上今年特斯拉一季度销量在全球范围内飙升到了 18 万辆以上，有着超过 200% 的涨幅，整体而言特斯拉的盈利处于上升状态，研发资金方面也无需忧愁。充足的资金，让特斯拉敢于为纯视觉自动驾驶路线「砸钱开路」。

特斯拉想在技术路线上保持自己的独特优势是可以理解的，据相关人士分析，如果特斯拉能在「纯视觉」上开辟出一条道路来，形成独特的自动驾驶技术闭环，无疑会让特斯拉距离「电动车界的苹果」更近一步。

当然，这个决策背后的商业风险也是不容忽视的。

因为另一边，随着随着技术发展，激光雷达不断完善优化，价格也在逐渐下降。

激光雷达头部公司 Velodyne 本周宣布，其最受欢迎的激光雷达系统 VLP-16 的价格相比 2016 年降低了一半。激光雷达价格下降受惠于产能、研发成本平摊；辅助自动驾驶推广等因素。

如今，已经有越来越多的车企选择了激光雷达，这意味着未来「激光雷达」的技术路线或许将比「纯视觉」路线拥有更多的规模效应以及成本优势。

而如果未来视觉+激光雷达一派，在自动驾驶能力上做到和特斯拉相差不多，则意味作为「破风者」的特斯拉，为纯视觉路线自动驾驶探索砸下的成本会和收益不成正比。这对于需要长期投入的特斯拉来说，将是不小的压力。

但对于马斯克而言，他不在乎。他似乎就是要在第一性原理的的思想下，以愚公移山的劲头，在自动驾驶领域跟「纯视觉路线」一路死磕到底。

编辑/Ray

本文來自微信公衆號：極客公園（ID：geekpark），作者：魚三隹

北京時間 8 月 20 日上午，特斯拉 AI 日如期召開，正如其名字預示的那樣，活動圍繞着 AI 人工智能展開。與以往不同的是，這次活動特斯拉沒有邀請媒體，也沒有邀請投資人，只邀請了相關領域的工程師們，因此拋開商業化的問題之後，這次活動更像是一場針對技術方面的前瞻性彙報與演示。

AI 日上，特斯拉人工智能和自動駕駛視覺總監 Andrej Karpathy 詳細介紹了特斯拉的「神經網絡」，特斯拉衆位高管也着重闡述了特斯拉在自動標記等技術上的進展，之前就備受關注的超級計算機 Dojo 也正式亮相了。

仔細觀察不難發現，特斯拉 AI 日上介紹的所有技術似乎都隱隱傳達着一個信號：即便越來越多的車企採用激光雷達技術實現自動駕駛，馬斯克依舊要特立獨行，勢將「純視覺路線」進行到底。

擁有超強算力的「道場」Dojo

五天前，特斯拉官方曾發佈一張海報預熱 AI 日活動。

海報上展示了一個大規模芯片模組的結構，包括芯片核心、銅板、散熱器、金屬外殼等組成元素，人們紛紛猜測這是否與特斯拉 AI 日上將公佈的新產品有關。事實證明確實如此。

特斯拉 AI 日宣傳海報｜特斯拉官網

這其實是一個集合了 25 塊 D1 芯片的訓練模塊，而自研 AI 訓練芯片 D1 可以說是 AI 日上最重磅的技術突破之一。

D1 芯片由特斯拉自主研發，7 納米制造工藝，單片 FP32 達到算力 22.6TOPs，BF16 算力 362TOPs，這幾乎是目前市面上最強的芯片。

而且 D1 芯片可以進行無縫融合，25 個 D1 芯片構成一個訓練模塊，更多的訓練模塊相互組合則構成了擁有更強大算力的超級計算機 Dojo。

Dojo 的名字不是第一次出現了，早在今年 6 月的 CVPR 2021 工坊活動上，Andrej Karpathy 就介紹過這臺超級計算機，當時的 Dojo 搭載的還是英偉達的芯片，總算力爲 1.8 EFLOPS，被認爲可以躋身全球第五強超級計算機。

這次搭載了 D1 的 Dojo 亮相後，計算機博弈專家、芯片專家吳韌稱讚這是「很精彩的設計」，甚至在朋友圈表示「如果 Elon 原意，或許這是 nVidia 最大的競爭者，實際上芯片巨頭們的坐次可能需要重新排位。」

馬斯克一直認爲「解決自動駕駛的唯一方法是解決現實世界中的 AI 問題，無論是硬件還是軟件，除非一家公司具有很強的 AI 能力以及超強算力，否則很難解決自動駕駛難題。」

因此特斯拉這次推出擁有強大算力的超級計算機 Dojo，其實也是出於解決自動駕駛問題的考量。與其他超算不同的是，這個被命名爲「道場」的超算，其所有力量只用來做一件事兒：訓練 Autopilot 在內的整個自動駕駛系統。

純視覺路線

「道場」已經建好，受訓的特斯拉 AI 神經網絡更是關鍵。

特斯拉的神經網絡主要用來處理物體識別和道路規劃等功能所需的數據，這些是支持特斯拉 Autopilot/FSD 得到基礎。

AI 日上，特斯拉 Autopilot 工程主管 Milan Kovac 向觀衆展示了特斯拉的 AI 神經網絡究竟是怎樣應用的。

特斯拉汽車的視覺組件｜特斯拉官網

在特斯拉的汽車中，每輛車裝有 8 個攝像頭，每個攝像頭獲取原始輸入後能創建不同的分辨率，用於不同的功能和目的，最終這些信息會被輸入到複雜的神經網絡中，生成對自動駕駛有用的附加信息。

然而問題在於，即便擁有 8 個攝像頭，其背後神經網絡的矢量空間依舊不夠。於是，特斯拉研發了自動標註技術，即便行駛過程中視野被遮擋，根據數據的標註，車輛也能更安全、準確的導航。

Andrej Karpathy 還稱，現在特斯拉的自動駕駛場景模擬系統可以在行駛過程中實時繪製路況，結合多個車輛經過同一地點的繪製，得到一個完整的地圖。

而這恰恰是特斯拉和 Waymo 等競爭對手最大的不同：基於類似人腦的視覺感知系統、自動化標註能力，以及仿真等功能，特斯拉在 Autopilot/FSD 上試圖擺脫激光雷達，力圖將「純視覺」路線走得更加徹底。

這確實是馬斯克一貫的堅持。

2019 年，馬斯克一句「把激光雷達裝在車上真的很蠢」，直接將自動駕駛技術路線一分爲二，激起千層浪。

以特斯拉爲代表的僅以攝像頭與各種傳感器作爲硬件，背後重算法的路線，與 Waymo 爲代表的注重激光雷達的技術路線，站在了對立面。

關於二者誰能走到最後，到今天也沒有出現一個決定性的結論。

激光雷達，顧名思義是以激光作爲信號源，由激光器發射出的脈衝激光打到周圍物體上引起散射，一部分光波會反射到激光雷達的接收器上，根據激光測距原理計算，就得到從激光雷達到目標點的距離。激光不斷掃描目標物，就可以得到全部數據，成像處理後，可得到精確的三維立體圖像。

而在馬斯克看來，「純視覺感知才是通往真實世界 AI 的道路」，既然人類是通過視覺收集信息輔以大腦處理信息的方式進行駕駛，那自動駕駛也應當能通過視覺感知輔以算法處理的方式實現安全駕駛。

當外部環境越來越複雜，自動汽車上安裝的傳感器也越來越多，如果雷達與攝像頭傳來的信息互相矛盾，自動駕駛系統反而會更加難以抉擇。

馬斯克拒絕「拉扯」，他選擇直接將攝像頭的作用發揮到極致。

將「第一性原理」貫徹到底？

熟悉馬斯克的人都知道他一直奉行「第一性原理」，即回歸事物最基本的條件，將其拆分成各要素進行結構分析，從而找到實現目標的最優路徑的方法。

目前「感知、判斷駕駛環境」無疑是自動駕駛領域的核心困難，馬斯克依舊回歸到「感知」的基礎，不遺餘力地將 AI 進化到能與人類視覺感知媲美的地步。

馬斯克認爲，毫米波雷達不擅長描述物體的缺陷是幾乎不可能彌補的，而攝像頭不擅長探測距離的缺陷卻是可以彌補的。爲了「一步到位」，馬斯克絲毫不考慮將激光雷達安裝在特斯拉上。

事實上，特斯拉的「純視覺路線」，需要更加深度地學習海量的數據，深度訓練神經網絡，這一點對於其他的自動汽車公司而言，絕不是敢輕易嘗試的。馬斯克能堅持下去，和其起步早、能積攢的數據多不無關係。

據高盛估計，目前特斯拉車隊的數量在全球超過 150 萬輛，這爲特斯拉提供了大量、多樣化和真實世界的數據庫。這意味着，即便數據採集效率相同，跑在路上的特斯拉數量是對手的數十倍，數據量也就是競爭對手的數十倍。

再加上今年特斯拉一季度銷量在全球範圍內飆升到了 18 萬輛以上，有着超過 200% 的漲幅，整體而言特斯拉的盈利處於上升狀態，研發資金方面也無需憂愁。充足的資金，讓特斯拉敢於爲純視覺自動駕駛路線「砸錢開路」。

特斯拉想在技術路線上保持自己的獨特優勢是可以理解的，據相關人士分析，如果特斯拉能在「純視覺」上開闢出一條道路來，形成獨特的自動駕駛技術閉環，無疑會讓特斯拉距離「電動車界的蘋果」更近一步。

當然，這個決策背後的商業風險也是不容忽視的。

因爲另一邊，隨着隨着技術發展，激光雷達不斷完善優化，價格也在逐漸下降。

激光雷達頭部公司 Velodyne 本週宣佈，其最受歡迎的激光雷達系統 VLP-16 的價格相比 2016 年降低了一半。激光雷達價格下降受惠於產能、研發成本平攤；輔助自動駕駛推廣等因素。

如今，已經有越來越多的車企選擇了激光雷達，這意味着未來「激光雷達」的技術路線或許將比「純視覺」路線擁有更多的規模效應以及成本優勢。

而如果未來視覺+激光雷達一派，在自動駕駛能力上做到和特斯拉相差不多，則意味作爲「破風者」的特斯拉，爲純視覺路線自動駕駛探索砸下的成本會和收益不成正比。這對於需要長期投入的特斯拉來說，將是不小的壓力。

但對於馬斯克而言，他不在乎。他似乎就是要在第一性原理的的思想下，以愚公移山的勁頭，在自動駕駛領域跟「純視覺路線」一路死磕到底。

編輯/Ray

譯文內容由第三人軟體翻譯。

以上內容僅用作資訊或教育之目的，不構成與富途相關的任何投資建議。富途竭力但無法保證上述全部內容的真實性、準確性和原創性。

马斯克：我信摄像头，我要死磕到底