share_log

特斯拉AI战队集结,首秀Dojo芯片,FSD将迎来巨变

特斯拉AI戰隊集結,首秀Dojo芯片,FSD將迎來鉅變

汽車之心 ·  2021/08/21 16:03

美西時間 8 月 19 日下午 5 點,特斯拉 AI Day 開場。

在簡短地講了幾分鐘開場白後,musk 開始向臺下找人,「Andrej......」

很快,年輕的特斯拉 AI 部門高級總監 Andrej Karpathy 微笑上場,正式拉開了 AI Day 的大幕。

這天,還有多位特斯拉的 AI 業務高管輪番登場,除了 Andrej 之外,還包括:

  • Ashok Elluswamy,Autopilot 軟件總監;

  • Ganesh Venkataramanan,Autopilot 硬件高級總監,Porject Dojo 負責人;

  • Milan Kovac,Autopilot 工程總監。

圖片

這支 AI 戰隊對外集中展示了特斯拉在Autopilot 感知算法規控算法仿真模擬雲端訓練自研芯片超算平臺等多個領域的「寶藏」成果。

這次的特斯拉 AI Day 有三大核心主線:

  • 自動駕駛 FSD 算法和神經網絡訓練進展;

  • 超算系統 Dojo 以及特斯拉自研的訓練芯片 D1;

  • 人形機器人 Tesla Bot。

繼 2019 年 Autonomy Day、2020 年 Battery Day 之後,特斯拉再次向我們展示了在汽車公司、自動駕駛軟件公司、電池公司和能源公司之外,特斯拉還是一家頂級的 AI 公司,甚至是全球最大的機器人公司。

在成為全球新能源車銷冠、全球市值第一的車企之後,Andrej Karpathy 等人帶領的這支 AI 戰隊,似乎向我們展示了特斯拉距離自己的邊界還很遠。

一面與 BBA 等豪華車企展開 PK,特斯拉還將與 Alphabet、NVIDIA 等頂級科技公司在人工智能戰場展開同場競技。

感知與決策:讓汽車擁有自我

感知、規劃、決策、執行,特斯拉從 2013 年前後就想讓車去實現自動駕駛。

圖片

為實現自動駕駛,特斯拉的基本邏輯是,建立類似於人類的純視覺感知技術,建立接近於人類算力的計算平臺(車載 FSD 芯片和雲端超算平臺),用大量的數據訓練大腦,使得汽車越來越擅長駕駛——讓汽車具有自我(ego)。

圖片

實現自動駕駛的首要前提是感知和決策,這一部分從特斯拉 AI Day 的一開場便由 Andrej 娓娓道來。

每輛特斯拉都搭載了8 顆攝像頭,它們採集的數據可以形成3D 矢量空間(Vector Space),如果再加上時間戳,便是特斯拉所稱的4D 自動駕駛系統

圖片

Andrej 形容利用深度學習進行感知識別,就像多任務模型「九頭蛇」,涉及到攝像頭探測、跨攝像頭融合等多個環節。

而藉助多攝像頭和神經網絡,特斯拉可以通過算法實時繪製地圖(SLAM)。

圖片

近年,特斯拉採用攝像頭來進行物體檢測和深度估算的精度已經超過了攝像頭+毫米波雷達的精度,因此 Autopilot 目前已經在量產車上移出了毫米波雷達。

感知之後的下一步,便是做好規劃控制。

另一位大神自動駕駛軟件總監 Ashok Elluswamy 登臺。

Ashok 認為,規劃有兩大難題,分別是:非凸面(Non-Convex)和高維(High-Dimensional)。

簡單來説,車輛在路面駕駛時,它的行為和路徑不是唯一的最優解,而是有多個不同的解法,並且是高度動態的。

舉一個換道中的例子,通常來講路徑分為兩種,一種是嘗試提早並且緩慢換道,但是不太舒適;另一種是較晚並迅速換道,但是這又會存在錯失換道的風險。

最優的方案是在換道時保持舒適和安全的平衡。車輛在進行規劃時,既考慮到車輛自身,還要考慮到每個道路交通參與者。

圖片

接下來,特斯拉展示了一段堪稱精彩的視頻。

在一個狹窄街道上,沒有車道線,道路兩旁停着各種車輛,狹窄道路的對向突然駛出一輛白色轎車,從主視角的角度可以發現,特斯拉很明顯向右避讓了一下,這一舉動正像人類駕駛要為對向車讓路。

不過,白色轎車禮貌地靠邊停下,給特斯拉留出空間。特斯拉繼續向前行駛。

Ashok 為大家揭開了視頻背後特斯拉 FSD 是如何「思考」的。

圖片

最初遇到對向來車時,那輛白色轎車被預測為要繞過其他車輛繼續前進的可能性是大概率事件,停車則是小概率事件。

所以,特斯拉選擇了靠邊停車讓行。

不過,對向來車選擇了小概率事件的停車,特斯拉獲取並理解了這一行為,然後選擇繼續前行。

簡單做個小結:

純視覺感知系統負責輸入數據,形成矢量空間(Vector Space)和中間層特徵(Intermediate Features),然後統一輸出給神經網絡,再進一步通過軌跡分佈模型(Trajectory Distribution)輸出給規劃控制系統(Planing & Control),最終向車輛輸出轉向或加速指令。

特斯拉如何消化海量數據?

自動駕駛車輛上路,就會源源不斷地生成大量數據。

如何分析、處理這些數據,並對算法進行訓練?

特斯拉恐怕是這個領域處理數據規模最大的公司。

特斯拉設立了人工數據標註自動數據標註仿真數據規模化(Scaling data geeneration)四個團隊。

目前,特斯拉自建了一支 1000 人的人工數據標註團隊。

Andrej 披露,在 4 年前,特斯拉也是和業界大部分公司一樣採用外包的第三方標註團隊,但後來發現,這樣做「延遲」太高,因此轉向自建標註團隊。

圖片

隨着數據量劇增,特斯拉又引入自動標註,由於特斯拉採用的是多攝像頭融合的感知,其自動標註工具可以在一次標註下,實現所有攝像頭多視角、多幀畫面的同步標註。

Andrej 在今年的 6 月舉辦的 CVPR 2021 活動上披露,特斯拉已擁有 100 萬個大約為 10 秒視頻數據,並且標註了視頻中的60 億個物體的距離、加速度和速度信息,這些數據量總計達1.5PB

至於仿真,特斯拉的「仿真場景技術」可以模擬現實中不太常見的「邊緣場景」(比如一家人在高速公路上跑步的場景),並將此用於自動駕駛訓練。

圖片

在仿真場景中,特斯拉工程師可以提供不同的環境以及其他參數(障礙物、碰撞、舒適度等),極大提升訓練效率。目前特斯拉在仿真器內自建了超過 200 英里的道路。

通過採集和仿真生產的龐大數據如何被用於高效訓練?

特斯拉的方案是自研超級計算機 Dojo

自研 Dojo 芯片,拿下最高算力桂冠

圖片

早在幾年前,在 musk 的授意下,特斯拉內部開始研發應用於 AI 訓練的高能效、高性能的超級計算機 Dojo。

到 2019 年 4 月,musk 在特斯拉 Autonomy Day 上首次公佈 Dojo 研發計劃,並在此後不斷為 Dojo 招募人才。

這屆特斯拉 AI Day 上排名首位的大殺器,當屬 Dojo

圖片

據特斯拉 Autopilot 硬件高級總監、Dojo 項目負責人 Ganesh Venkataramanan 介紹,Dojo 有三大研發目標:

  • 實現最出色的 AI 訓練效果;

  • 能夠容納更大型、更龐大的混合神經網絡模型;

  • 功耗和成本優化,做到性價比更高。

特斯拉認為,超級計算機的研發,提高算力是容易的,但是對帶寬進行擴展以及控制延遲是非常困難的。

基於此,特斯拉從芯片的層面開始設計。

從芯片開始自研發 Dojo 並不是一件簡單的事。

芯片產業鏈包括設計、製造和封測三大環節,如何解決能效和冷卻問題,每個領域均充滿挑戰。

D1 採用分佈式架構,7 納米工藝,每個 D1 芯片搭載 500 億個晶體管、354 個訓練節點,單芯片 BF16 精度下算力高達362 TFLOPs,功耗卻只有400W,兼具 GPU 級別的訓練能力和 CPU 級別的可控性。

圖片

在封測環節,Dojo 芯片採用的是InFO_SoW 技術,初代 WSE 芯片和和臺積電 WLSI 平臺,均由 InFO_SoW 封裝而成。

InFo_SoW,又稱「晶圓上系統」技術,是將所有的芯片在同一個晶圓上進行設計,將整個晶圓做成一個超大芯片。

這樣做的好處是,可以實現通信低延遲、高帶寬。

簡單來説,由於芯片與芯片之間的物理距離極短,而且通訊結構可以直接在晶圓上佈置,使得所有內核都能使用統一的2D 網狀結構互連,實現了芯片間通信的超低延遲高帶寬;以及由於結構優勢實現了較低的PDN 阻抗,實現了能效的提升。

此外,由於是陣列多個小芯片組成,還可以通過宂餘設計來避免"良品率"問題,實現芯片處理的靈活性。

最終,一款可以用於 AI 訓練的高算力芯片 D1 亮相。

基於 D1 芯片,特斯拉又將自研芯片集成為訓練模塊,分為七層結構:

圖片

  • 第一層和第五層銅質結構是水冷散熱模塊;

  • 第二層結構由 5*5 陣列共 25 個芯片組成;

  • 第三層為 25 個陣列核心的 BGA 封裝基板;

  • 第四層和第七層是物理承載結構,附帶一些導熱屬性;

  • 第六層是功率模塊,以及上面豎着的黑色長條,穿過散熱與芯片進行高速通信的互聯模塊。

特斯拉將 25 個 D1 芯片組成一個「訓練模塊」,大約 60 個訓練模塊,也就是 1500 個 D1 芯片共53 萬餘訓練節點,就組成了 Dojo 超級計算機。

理論上,Dojo 的性能拓展沒有上限,可以無限擴張。

實際應用中,特斯拉將 120 個訓練模塊組裝成了ExaPOD 超級計算機,ExaPOD 含有 3000 個 D1 芯片超 100 萬個訓練節點,算力可以達到1.1 EFLOP

圖片

1.1 EFLOP 這個成績,將 Dojo 直接送讓了史上最快AI 訓練計算機的王座。

接下來,下一代的 Dojo 芯片還將提升10 倍性能。

如果説 FSD 芯片解決車端的問題,那麼 Dojo 要解決的便是雲端的問題。

musk 透露,Dojo 會在明年投入使用。

隨着 D1 芯片的登場,Dojo 將在 AI 訓練的道路上快步急行,特斯拉的 FSD 自動駕駛軟件能力也將大幅提升。

機器人?特斯拉的未來

D1 芯片不會止步於 Dojo,未來特斯拉還可能會基於 D1 進軍機器人賽道。

在 AI Day 上,Musk 第一次公開了:特斯拉要做人形機器人 Tesla Bot,這款機器人高 1.72 米,重 56.6 千克,將搭載特斯拉的各項先進技術,比如 Autopilot 攝像頭、FSD 和 Dojo 人工智能算法等,並且可以和特斯拉汽車聯動。

圖片

按照計劃,特斯拉或將在明年推出首個機器人原型機。

如今,特斯拉的邊界正在不斷延展。

它首先肯定是一家車企,今年第二季度特斯拉共交付整車201304 輛,創下歷史季度新高。

特斯拉預計其 2021 年汽車交付量將同比增長超過 50%,也就是在去年 49.95 萬輛的基礎上增長到約 75 萬輛。這個銷量仍高居全球新能源汽車銷量榜首。

從 2013 年開始研發自動駕駛起,特斯拉就打上了科技公司的烙印。

可以預見特斯拉的下一階段,大概率將是一場高效利用數據、超級計算機和深度學習等多個要素的天才遊戲。

暫且不提是否可以商業化的機器人,這場遊戲的首要戰果就是早一天實現全自動駕駛。

一方面作為車企的特斯拉越來越科技化,科技公司也在邁入造車行列,比如在中國的百度。

就在特斯拉 AI Day 兩天前,百度在其世界大會上也發佈了自研芯片,同樣基於7nm工藝量產的崑崙 2。

崑崙 2 的峯值算力是256 Tops,據説有可能在 2023 年量產的集度汽車上使用。

今年特斯拉 AI Day 沒有馬上可以兑現的技術,Dojo 明年投用,Tesla Bot 沒有明確的量產時間。

有意思的是,特斯拉 FSD 最早在 2019 年量產發佈,但在 AI Day 當天,完全沒有提 FSD 二代芯片。

按正常的節奏,我們猜測明年特斯拉應該要發佈下一代 FSD 芯片了。

隨着 Dojo 的出現,讓特斯拉 FSD 會發生量變到質變的飛越,FSD 二代芯片又會發生何種變化,也非常令人期待。

編輯/gary

譯文內容由第三人軟體翻譯。


以上內容僅用作資訊或教育之目的,不構成與富途相關的任何投資建議。富途竭力但無法保證上述全部內容的真實性、準確性和原創性。
    搶先評論