來源:汽車之心
作者:周彥武
牛牛敲黑板:
1、Mobileye EyeQ6:擁抱英特爾,追逐高性能。
2、瑞薩R-CAR V3U:強勢日系廠商,靈活高性價比。
3、英偉達Orin:極致性能,新造車青睞。
4、高通Snapdragon Ride:進擊的移動芯片霸主。
5、華為MDC:國貨之光,封鎖之下何去何從。
6、作者認為,最終高通和瑞薩有希望勝出。
自動駕駛系統前裝量產的開發週期大約 2 到 3 年,因此計算平臺廠家都是提前 2 到 3 年提供芯片樣片。
整個系統開發完成後,芯片才開始量產。
這樣一來,實際上 2023 年後的自動駕駛芯片格局,今天就已經基本確定了。
自動駕駛芯片開發成本高昂,且出於對高性能、低功耗的要求,其製造至少需要 7 納米和 5 納米的製程工藝。
這個級別的工藝對出貨量要求比較高:
一方面因為臺積電幾乎壟斷 7 納米以下的高性能芯片代工,產能緊缺。
訂單量太低的話,芯片廠商將在臺積電的序列中等待排期。
這個排期長達 1 年半到 3 年。
在這個時間內,芯片廠商肯定會失去客户。
另一方面,7 納米以下芯片的開發成本高昂,動輒 10 億美元起。
如果沒有足夠多的出貨量攤銷,芯片單價會很高,反過來也會影響銷售。
在現在市場的主要玩家中,特斯拉和蘋果的系統封閉軟硬一體化,不對外單獨出售芯片。
華為提供 MDC 計算平臺,但其芯片也不對外單獨出售。
當前,能夠提供高性能自動駕駛芯片,並在市場中擁有一席之地的全球獨立芯片廠商主要還有:Mobileye、英偉達、瑞薩、高通。
其對應的芯片產品如下:
因為這些芯片涉及到多個版本,這裏對比的都是頂配產品。
Mobileye EyeQ6:擁抱英特爾,追逐高性能
2019 年底,Mobileye EyeQ 芯片全球累計出貨超過 5400 萬片。
2020 年 9 月,Mobileye 透露,EyeQ 芯片全球出貨量超過 6000 萬片。
這 6000 萬片是 EyeQ2、EyeQ3 和 EyeQ4 之和,其中 2020 年新增的部分主要是 EyeQ4。
目前 EyeQ5 還未批量出貨。
EyeQ5 提供的算力水平是最高 24 TOPS,跟其他幾家相比,這個算力水平要遜色不少。
EyeQ6 才是 Mobileye 真正發力高性能的高端。
EyeQ6 預計於 2024/2025 年量產,分為高中低三個版本。
Mobileye 在 2016 年開始設計 EyeQ5,選定了 MIPS 的 I6500 做架構。
MIPS 在 I6500 架構之上,推出了特別針對車規的 I6500-F,而後續的 I7200 是針對無線市場的。
因此,Mobileye在之後的一代芯片上,放棄了 MIPS 架構,而決定採用英特爾的 Atom 內核[1]。
Atom 是英特爾處理器系列的常青樹,典型車載平臺是 Apollo Lake。
2016 年 6 月,英特爾從 Apolllo Lake 切換到 Goldmont 架構,並先後在特斯拉、寶馬、卡迪拉克、紅旗、現代、沃爾沃、奇瑞的車機上大量使用。
其中寶馬採用的最多,幾乎全系列都是。
特斯拉 Model 3 也是用的 Apolllo Lake。
最新的 Atom 系列,是 2020 年 9 月推出的 Elkhart Lake 系列即 x6000E,使用 Tremont 架構。
相比上代架構,Tremont 架構主要增加了 L2 cache,工藝從 14 納米提升到 10 納米,運行頻率略微提高約 200MHz,最高睿頻可達 3.0GHz。
和上一代一樣,Tremont 架構最多也是4核。
整體上,Mobileye 的芯片更新速度較慢。
加上最近英特爾的 CPU 核心業務受到來自蘋果、微軟和 AMD 的打擊,公司市值下滑明顯。
EyeQ6 要到 2024 年才量產,在各家的競爭中也顯得有些落後了。
瑞薩R-CAR V3U:強勢日系廠商,靈活高性價比
瑞薩是全球第二大汽車半導體廠家,全球第一大汽車 MCU 廠家,也是日本除索尼(索尼的主營業務主要是圖像傳感器)外最大的半導體廠家。
在高性能車載計算方面,瑞薩目前最頂級的產品是R-CAR H3,主要用在座艙領域。
最初 R-CAR H3 也考慮了自動駕駛應用,但 R-CAR H3 設計時間是 2013 年。
很難預料到今天客户對AI算力和 CPU 算力的需求這麼強。
R-CAR H3 沒有內置 AI 加速器,CPU 算力也只有 40K,顯然達不到自動駕駛系統開發的要求。
目前主要被用在座艙量產中,比如 2021 款長城 H6。還有 R-CAR M3 被用於大眾中國車型的座艙上。
瑞薩在 2017 年開始加強高算力芯片的設計。
2019年推出第一個視覺 SoC,即R-CAR V3H。
這顆芯片的 AI 算力有 4 TOPS,博世的下一代視覺系統內嵌 V3H,也包括一些日系的全自動泊車系統。
2018 年,瑞薩開始設計 V3H 的加強版 V3U,到 2020 年基本完成設計。
目前外部已經可以申請 V3U 的樣片,這個速度比其他三家都要快一些。
V3U 的量產預計在2023 年初,豐田和本田也參與了這款芯片的設計工作。
日本車企和供應商之間的抱團非常緊密,我認為豐田和本田自動駕駛系統大概率會採用 V3U。
V3U 內部框架如上圖:採用 8 核 A76 設計。
瑞薩沒有像特斯拉一樣,堆了 12 個 A72,而是使用了 ARM 的 Corelink CCI-500,即 Cache 一致性互聯。
V3U 的視頻處理管線如上圖,可以看到 V3U 有很多硬核的計算機視覺模塊,包括立體雙目視差,稠密光流、CNN、DOF、STV、ACF 等。
在計算機視覺功能方面,支持包括圖像格式化、目標追蹤、車道檢測、自由空間深度、場景標註、語義分割、檢測分類等模塊。
為了節約成本,降低功耗,同時也聚焦於車載應用需求,瑞薩沒有使用太昂貴的 GPU,只是增加了一個低功耗 GPU,即:
Imagination Technologies 的 PowerVR GE7400,1 個着色器集羣+ 32 個 ALU核心,算力只有38.4 GFLOPS@600MHz。
考慮到成本因素,瑞薩沒有使用時髦的 7 納米,而是12 納米工藝,並且是從原瑞薩 R-CAR H3 的 16 納米 FinFET 工藝升級到 12 納米 FFC 工藝,一次性支出很少。
但是論到 AI 性能,絲毫不次於那些 5 納米芯片,瑞薩聲稱 V3U 達到了驚人的 13.8 TOPS/W 的能效比,是頂配 EyeQ6 的 6 倍之多[2]。
V3U 也是一個系列產品,針對不同層級自動駕駛的需求可以提供多個版本,這樣做是為了進一步提高出貨量,降低成本。
V3U 的產品系列採用的是模塊化設計,A76 可以是 2、4、8 核。
GPU 也可以不要,外設也可以輕鬆增減,靈活性很強。
在 Mobileye、瑞薩、英偉達、高通四大自動駕駛芯片廠家中,只有瑞薩的主業是汽車半導體,因此對車規安全重視程度最高,V3U 的規劃目標是ASIL-D。
英偉達 Orin:極致性能,新造車青睞
英偉達於 2019 年底發佈了 Orin 芯片:
預計在 2022 年或 2023 年量產,2021 年初有樣片提供。
關於 Orin 的公開資料一直還停留在 2019 年底發佈時。
據説圍繞 Orin 的軟件工作異常複雜,硬件已經完全就緒,可能要到 2023 年底才能量產。
Orin 性能一流,但價格可能非常昂貴。
L4 級自動駕駛,自然也是非常昂貴的。主芯片上降低幾百美元,對上萬美元的系統來説也是杯水車薪。
大部分廠家在 L4 的投入上,都是為了樹立旗幟,製造高科技形象。
大規模量產難度很高,配套的 V2X、高精度地圖和高精度定位都很不成熟,法規也需要修改。
因此,開發初期廠商對成本不敏感。換句話説,車廠沒指望在主芯片上降低成本。
與 R-CAR V3U 一樣,英偉達 Orin 也是一個系列產品。
後者的低端產品可能只有 2 到 4 個 A78 內核,20 到 40 TOPS 的 AI 算力,可能沒有 Ampere GPU 或少數核心。
高通Snapdragon Ride:進擊的移動芯片霸主
關於高通Snapdragon Ride的公開信息很少。
高通的核心業務還是在移動端,因此高通的策略是最大程度地利用手機領域的研發成果。
按照這個策略,高通最新的Snapdragon 888(即 SM 8350)芯片會最接近 Snapdragon Ride SoC。
高通的 Ride 平臺和英偉達類似,也是基於 SoC+AI 加速器的分離方式。
高通聲稱 888芯片會採用三星 5 納米 5LPE 工藝製造,並且是兩年半前就決定的。
但目前三星的 5 納米還沒有一個廠家使用,而臺積電的 5 納米已經經過蘋果 A14 驗證過。
論關鍵指標晶體管密度,三星的 8 納米與臺積電的 12 納米差不多。
三星的 5 納米跟臺積電的 10 納米差不多,明顯低於臺積電的加強版 7 納米。
但臺積電 5 納米產能被蘋果包了,高通只能找三星。
在 888 芯片上:
Arm 的 Cortex-A78 和 Cortex-X1 都是基於上一代 Cortex-A77。
但這兩款 Arm 處理器的設計目標不同:
Cortex-A78 側重於提供更高的每瓦性能,同時體積更小,而 Cortex-X1 則是追求最大性能。
Cortex-X1 是 Arm「CXC 項目」的第一款商用產品。
性能方面,Cortex-X1將比 Cortex-A77 提高 30%。
與 Cortex-A78 相比,Cortex-X1 的整數運算性能提升了 23%。
Cortex-X1 還擁有兩倍於 Cortex-A78 的機器學習能力。
Cortex-X1 就相當於「超大核」,它在架構設計上與 Cortex-A78 如出一轍,但幾乎在每個地方都進行了擴展。
ARM對 Cortex-X1 的定義是「可定製」移動平臺,芯片商可以根據預算和需求向 ARM 提出要求。
然後 ARM 再根據不同的應用場景,調整 Cortex-X1 各個模塊的規格設計。
即便 S888 非常強大,但因為三星的 5 納米工藝,晶體管密度遠不如臺積電 5 納米,也不如臺積電 7 納米。
因此,S888 的單核性能仍然落後蘋果上一代的 A13,跟臺積電 5 納米的 A14 比差距更是非常明顯,A14 比 S888 單核跑分高 41%。
GPU 方面更能凸顯三星工藝的落後。
根據 GFXBench Aztec 測試:
A14 峯值達到每秒 102.24 幀
A13 達到 91.62 幀
S888 只有 86.00 幀
華為的麒麟 9000 是 82.74 幀。
AI 性能方面,S888 得分很高,用 UL Procyon 測試 AI 推理為 32228。
華為的麒麟 9000 是 12596,S888 幾乎是麒麟的三倍。
S888 理論值 26 TOPS,也比蘋果 A14 的 21 TOPS 高。
Ride 平臺應用於自動駕駛領域,因此高通可以砍掉 S888 上的 X60 5G Modem,留出更多地方放 NPU,AI 算力估計可以達到 30-40 TOPS。
考慮到成本和車規,高通不會增加太多 AI 算力,因為高通還留了加速器,也就是類似英偉達 A100。
華為 MDC:國貨之光,封鎖之下何去何從
華為的自動駕駛計算平臺由車 BU 下的 MDC 產品部負責。
MDC 上採用的 AI 協處理器是昇騰系列芯片,而 CPU 來自華為的泰山服務器事業部,即鯤鵬系列芯片。
MDC 全稱是Mobile Data Center,移動數據中心。
MDC 的成員部分來自華為的中央硬件部,後者以開發 ARM 服務器為主要業務,之後轉到自動駕駛領域。
MDC 的芯片部分仍由海思提供。
MDC 目前主打兩款產品:
一款是用在 L2+ 上的 MDC 210
另一款 MDC 610,主要用在 L4 上
MDC 210 的 CPU 部分未知,AI 處理器是昇騰 310。
MDC 610 的 CPU 很可能是鯤鵬 916,AI 處理器是昇騰 610。
鯤鵬 916,在海思內部代號是 Hi1616,是 2017 年的產品。
其採用 32 核 ARM A72 並聯設計,最低功耗 75 瓦,標準 TDP 功耗 85 瓦,對標英特爾至強系列服務器 CPU。
華為鯤鵬 916 參數與內部框架圖如上:
採用了16 納米工藝,也就是説中芯國際能夠代工。
鯤鵬系列更高級的產品是 920,海思內部代號 Hi1620,採用了 16 - 96 核設計,華為自研的架構,ARM v8.2 指令集,7 納米工藝。
鯤鵬930 計劃採用 5 納米工藝。
上面説到,華為 MDC 的 AI 處理器主要是昇騰 310 和 610。
按照華為的路線圖,官方原計劃在 2020 年推出昇騰 320、610 和 920,但一直到目前都沒有消息。
昇騰 310 是採用臺積電 12 納米 FFC 工藝製造,於 2018 年推出,因此性能一般,只有 16TOPS 算力。
從華為的官方介紹看,昇騰920 和 610 都是定位於服務器深度學習訓練用的,不是用於車載應用。
這兩款處理器有明顯的 Cowos 多存儲芯片封裝設計,這種封裝成本也很高,不適用於成本敏感的領域。
誰是最強芯片?
整體回顧:五大廠商中,瑞薩主打超高性價比,並且設計之初就有整車廠支持。
在日系車企中,除了國際化程度比較高的日產,其他廠商毫無疑問都會傾向於瑞薩的 V3U。
瑞薩在車規安全方面積累較多,這也是德系廠商非常關心的。
因此出身車載半導體領域的瑞薩比較受日系和德系廠商青睞。
Mobileye有超過 6000 萬片出貨,有龐大用户基礎,美系、韓系還有國內自主品牌都傾向於 Mobileye,但目前 EyeQ 系列產品推出速度太慢。
這也是理想、蔚來等多家新晉廠商放棄 EyeQ 平臺的原因。
英偉達性能一流,至於價格,用黃教主的話説,「買得越多,省得越多」。
新興造車企業追求高性能,蔚來、理想、小鵬幾家手上也有幾百億元的現金儲備,英偉達在其中頗受青睞。
高通Snapdragon Ride 平臺與瑞薩類似,主打性價比,並且高通的原廠支持力度比較大。
目前,長城以及一家眾所周知的造車新勢力頭部公司已經選擇了 Ride 平臺。
華為最大的掣肘因素在於芯片的產能。
目前中芯國際的 14 納米工藝不算成熟,從財務數據看,中芯 14 納米業務僅佔其收入的 1%。
眼下中芯國際也被美國製裁,工藝和產能提升都十分困難。
即便解除封鎖,華為也不會對外單獨銷售芯片。
無論車企選擇使用哪個平臺,都需要芯片原廠提供充足的支持。
在這方面,瑞薩高階的原廠工程師都在日本,支持力度較差。
英偉達人力資源有限,據説其支持力度也不太友好。
高通在經歷移動端的多年磨礪,非常適應於為幾十個廠家做支持。
結合 Mobileye 的推新節奏,我認為,最終高通和瑞薩有希望勝出。
參考資料:
[1]https://www.eenewsautomotive.com/news/we-need-standardized-criteria-autonomous-driving/page/0/4。
[2]https://eetimes.jp/ee/articles/2012/21/news067.html,CNN-IPも自社で開発したものだ。理論上の最高性能は60TOPSで、1W當たりの性能は最高で13.8TOPS。
編輯/Jeffy