share_log

马斯克:我信摄像头,我要死磕到底

馬斯克:我信攝像頭,我要死磕到底

極客公園 ·  2021/08/21 21:34

本文來自微信公衆號:極客公園(ID:geekpark),作者:魚三隹

北京時間 8 月 20 日上午,特斯拉 AI 日如期召開,正如其名字預示的那樣,活動圍繞着 AI 人工智能展開。與以往不同的是,這次活動特斯拉沒有邀請媒體,也沒有邀請投資人,只邀請了相關領域的工程師們,因此拋開商業化的問題之後,這次活動更像是一場針對技術方面的前瞻性彙報與演示。

AI 日上,特斯拉人工智能和自動駕駛視覺總監 Andrej Karpathy 詳細介紹了特斯拉的「神經網絡」,特斯拉衆位高管也着重闡述了特斯拉在自動標記等技術上的進展,之前就備受關注的超級計算機 Dojo 也正式亮相了。

仔細觀察不難發現,特斯拉 AI 日上介紹的所有技術似乎都隱隱傳達着一個信號:即便越來越多的車企採用激光雷達技術實現自動駕駛,馬斯克依舊要特立獨行,勢將「純視覺路線」進行到底。

擁有超強算力的「道場」Dojo

五天前,特斯拉官方曾發佈一張海報預熱 AI 日活動。

海報上展示了一個大規模芯片模組的結構,包括芯片核心、銅板、散熱器、金屬外殼等組成元素,人們紛紛猜測這是否與特斯拉 AI 日上將公佈的新產品有關。事實證明確實如此。

85

特斯拉 AI 日宣傳海報|特斯拉官網

這其實是一個集合了 25 塊 D1 芯片的訓練模塊,而自研 AI 訓練芯片 D1 可以說是 AI 日上最重磅的技術突破之一。

D1 芯片由特斯拉自主研發,7 納米制造工藝,單片 FP32 達到算力 22.6TOPs,BF16 算力 362TOPs,這幾乎是目前市面上最強的芯片。

而且 D1 芯片可以進行無縫融合,25 個 D1 芯片構成一個訓練模塊,更多的訓練模塊相互組合則構成了擁有更強大算力的超級計算機 Dojo。

Dojo 的名字不是第一次出現了,早在今年 6 月的 CVPR 2021 工坊活動上,Andrej Karpathy 就介紹過這臺超級計算機,當時的 Dojo 搭載的還是英偉達的芯片,總算力爲 1.8 EFLOPS,被認爲可以躋身全球第五強超級計算機。

這次搭載了 D1 的 Dojo 亮相後,計算機博弈專家、芯片專家吳韌稱讚這是「很精彩的設計」,甚至在朋友圈表示「如果 Elon 原意,或許這是 nVidia 最大的競爭者,實際上芯片巨頭們的坐次可能需要重新排位。」

馬斯克一直認爲「解決自動駕駛的唯一方法是解決現實世界中的 AI 問題,無論是硬件還是軟件,除非一家公司具有很強的 AI 能力以及超強算力,否則很難解決自動駕駛難題。」

因此特斯拉這次推出擁有強大算力的超級計算機 Dojo,其實也是出於解決自動駕駛問題的考量。與其他超算不同的是,這個被命名爲「道場」的超算,其所有力量只用來做一件事兒:訓練 Autopilot 在內的整個自動駕駛系統。

純視覺路線

「道場」已經建好,受訓的特斯拉 AI 神經網絡更是關鍵。

特斯拉的神經網絡主要用來處理物體識別和道路規劃等功能所需的數據,這些是支持特斯拉 Autopilot/FSD 得到基礎。

AI 日上,特斯拉 Autopilot 工程主管 Milan Kovac 向觀衆展示了特斯拉的 AI 神經網絡究竟是怎樣應用的。

85

特斯拉汽車的視覺組件|特斯拉官網

在特斯拉的汽車中,每輛車裝有 8 個攝像頭,每個攝像頭獲取原始輸入後能創建不同的分辨率,用於不同的功能和目的,最終這些信息會被輸入到複雜的神經網絡中,生成對自動駕駛有用的附加信息。

然而問題在於,即便擁有 8 個攝像頭,其背後神經網絡的矢量空間依舊不夠。於是,特斯拉研發了自動標註技術,即便行駛過程中視野被遮擋,根據數據的標註,車輛也能更安全、準確的導航。

Andrej Karpathy 還稱,現在特斯拉的自動駕駛場景模擬系統可以在行駛過程中實時繪製路況,結合多個車輛經過同一地點的繪製,得到一個完整的地圖。

而這恰恰是特斯拉和 Waymo 等競爭對手最大的不同:基於類似人腦的視覺感知系統、自動化標註能力,以及仿真等功能,特斯拉在 Autopilot/FSD 上試圖擺脫激光雷達,力圖將「純視覺」路線走得更加徹底。

這確實是馬斯克一貫的堅持。

2019 年,馬斯克一句「把激光雷達裝在車上真的很蠢」,直接將自動駕駛技術路線一分爲二,激起千層浪。

以特斯拉爲代表的僅以攝像頭與各種傳感器作爲硬件,背後重算法的路線,與 Waymo 爲代表的注重激光雷達的技術路線,站在了對立面。

關於二者誰能走到最後,到今天也沒有出現一個決定性的結論。

激光雷達,顧名思義是以激光作爲信號源,由激光器發射出的脈衝激光打到周圍物體上引起散射,一部分光波會反射到激光雷達的接收器上,根據激光測距原理計算,就得到從激光雷達到目標點的距離。激光不斷掃描目標物,就可以得到全部數據,成像處理後,可得到精確的三維立體圖像。

而在馬斯克看來,「純視覺感知才是通往真實世界 AI 的道路」,既然人類是通過視覺收集信息輔以大腦處理信息的方式進行駕駛,那自動駕駛也應當能通過視覺感知輔以算法處理的方式實現安全駕駛。

當外部環境越來越複雜,自動汽車上安裝的傳感器也越來越多,如果雷達與攝像頭傳來的信息互相矛盾,自動駕駛系統反而會更加難以抉擇。

馬斯克拒絕「拉扯」,他選擇直接將攝像頭的作用發揮到極致。

將「第一性原理」貫徹到底?

熟悉馬斯克的人都知道他一直奉行「第一性原理」,即回歸事物最基本的條件,將其拆分成各要素進行結構分析,從而找到實現目標的最優路徑的方法。

目前「感知、判斷駕駛環境」無疑是自動駕駛領域的核心困難,馬斯克依舊回歸到「感知」的基礎,不遺餘力地將 AI 進化到能與人類視覺感知媲美的地步。

馬斯克認爲,毫米波雷達不擅長描述物體的缺陷是幾乎不可能彌補的,而攝像頭不擅長探測距離的缺陷卻是可以彌補的。爲了「一步到位」,馬斯克絲毫不考慮將激光雷達安裝在特斯拉上。

事實上,特斯拉的「純視覺路線」,需要更加深度地學習海量的數據,深度訓練神經網絡,這一點對於其他的自動汽車公司而言,絕不是敢輕易嘗試的。馬斯克能堅持下去,和其起步早、能積攢的數據多不無關係。

據高盛估計,目前特斯拉車隊的數量在全球超過 150 萬輛,這爲特斯拉提供了大量、多樣化和真實世界的數據庫。這意味着,即便數據採集效率相同,跑在路上的特斯拉數量是對手的數十倍,數據量也就是競爭對手的數十倍。

再加上今年特斯拉一季度銷量在全球範圍內飆升到了 18 萬輛以上,有着超過 200% 的漲幅,整體而言特斯拉的盈利處於上升狀態,研發資金方面也無需憂愁。充足的資金,讓特斯拉敢於爲純視覺自動駕駛路線「砸錢開路」。

特斯拉想在技術路線上保持自己的獨特優勢是可以理解的,據相關人士分析,如果特斯拉能在「純視覺」上開闢出一條道路來,形成獨特的自動駕駛技術閉環,無疑會讓特斯拉距離「電動車界的蘋果」更近一步。

當然,這個決策背後的商業風險也是不容忽視的。

因爲另一邊,隨着隨着技術發展,激光雷達不斷完善優化,價格也在逐漸下降。

激光雷達頭部公司 Velodyne 本週宣佈,其最受歡迎的激光雷達系統 VLP-16 的價格相比 2016 年降低了一半。激光雷達價格下降受惠於產能、研發成本平攤;輔助自動駕駛推廣等因素。

如今,已經有越來越多的車企選擇了激光雷達,這意味着未來「激光雷達」的技術路線或許將比「純視覺」路線擁有更多的規模效應以及成本優勢。

而如果未來視覺+激光雷達一派,在自動駕駛能力上做到和特斯拉相差不多,則意味作爲「破風者」的特斯拉,爲純視覺路線自動駕駛探索砸下的成本會和收益不成正比。這對於需要長期投入的特斯拉來說,將是不小的壓力。

但對於馬斯克而言,他不在乎。他似乎就是要在第一性原理的的思想下,以愚公移山的勁頭,在自動駕駛領域跟「純視覺路線」一路死磕到底。

編輯/Ray

譯文內容由第三人軟體翻譯。


以上內容僅用作資訊或教育之目的,不構成與富途相關的任何投資建議。富途竭力但無法保證上述全部內容的真實性、準確性和原創性。
    搶先評論