特斯拉HW 4.0芯片準備量產,算力競賽要升級?
特斯拉的新一代自動駕駛芯片即將進入量產階段,它會開啟新一輪算力競賽嗎?
近日,臺灣媒體報道臺積電已經拿下特斯拉的芯片大單,將以 4nm 或 5nm 工藝生產特斯拉 Hardware 4.0 自動駕駛芯片。這一消息說明特斯拉的新一代自動駕駛芯片已經完成了設計,開始準備量產。
在特斯拉的帶動下,自動駕駛芯片的算力競賽又要升級了嗎?
自動駕駛芯片從合作到自研,馬斯克攤牌了
特斯拉的智能駕駛功能經歷了從 Autopilot 1.0 到 Autopilot 2.0、再到 FSD(Full-Self Driving)的迭代升級,其硬件系統也從 Hardware 1.0 逐步升級至 Hardware 3.0。
在 HW 1.0 時代,特斯拉采用了來自 Mobileye 的 EyeQ 系列芯片。Mobileye 的風格穩健,特斯拉則非常激進,兩者對于自動駕駛的理念有很大的沖突。于是在2016年, Mobileye 主動宣布與特斯拉終止合作。
進入 HW 2.0 時代,特斯拉找到了英偉達作為 Mobileye 的替代,采用定制版的英偉達 Drive PX2 自動駕駛計算平臺(由 1 顆 Tegra Parker 芯片和 1 顆 Pascal 架構 GPU 芯片構成)。后來又升級為 HW 2.5,增加了一顆 Tegra Parker 芯片。
不過,特斯拉的老板馬斯克并不喜歡受制于人,他會想盡辦法把核心技術掌握在自己手里。于是,在與英偉達合作的同時,他找來了芯片界的傳奇大神Jim Keller,開始自研自動駕駛芯片。
HW 3.0 由特斯拉自主研發,它的另一個名字更加為人所熟知:FSD computer,完全自動駕駛計算平臺。有了自研芯片之后,底氣十足的馬斯克光速翻臉,在HW 3.0的發布會上瘋狂 diss 前合作伙伴英偉達,稱英偉達的芯片算力低、功耗大。
HW 3.0 為自動駕駛提供了強大的算力支持。和采用英偉達芯片的 HW 2.5 相比,HW 3.0的圖像處理速度提升了21倍,成本降低了20%,代價僅僅是功耗從 57w 增加到了 72w。
在此之前,無法想象一家車企能夠擁有如此強大的芯片設計能力。HW 3.0 徹底奠定了特斯拉在自動駕駛領域的領先地位,將特斯拉送上神壇。
算力競賽:來自英偉達和高通的反擊
備受羞辱的英偉達老板黃仁勛一邊在 twitter 上與馬斯克開戰,一邊籌劃著反擊。HW 3.0 發布幾個月之后,英偉達推出了最新的 Orin 芯片,不論是單芯片算力還是計算平臺算力都遠超特斯拉 HW 3.0。
英偉達 Orin 自動駕駛芯片
不過,英偉達只能過過嘴癮,在這個時間點特斯拉 HW 3.0 已經量產裝車了,而英偉達 Orin 還停留在 PPT 上,直到今年才出現在量產車上。
面臨同樣情況的還有高通。在 2020 年初,高通發布了 Snapdragon Ride 自動駕駛計算平臺,其算力和能效比都碾壓了特斯拉 HW 3.0。不過尷尬的是,高通的產品也是期貨,要等到 2023 年才會量產。
除了英偉達和高通,國內的芯片廠商地平線、黑芝麻也發布了能夠超越特斯拉 HW 3.0 的產品,不過他們也還沒有進入量產裝車的階段。
特斯拉的領先秘訣:無視行業規則
特斯拉 HW 3.0 之所以能夠取得領先,關鍵在于“快”。HW 3.0 在 2016 年初開始研發,2019 年 4 月發布,幾個月之后就量產了。
而英偉達和高通的自動駕駛芯片發布之后,需要再等 2 年左右才能在量產車上體驗到。
英偉達和高通是沒有能力還是不著急?都不是,而是因為他們的客戶都是車企,所以芯片要滿足汽車行業的各項標準,需要經歷長時間的測試、達到車規級的 ASIL-D 安全等級。
在特斯拉的字典里,并不存在“車規級”
特斯拉特立獨行,根本就無視傳統汽車行業堅守的車規級標準,事事快人一步,自然就能步步領先。不過,特斯拉的這種做法也許會帶來一定的安全隱患。
展望特斯拉HW 4.0:能否刷新算力上限?
目前,英偉達的 Orin 芯片已經投入量產,高通 Snapdragon Ride 也蓄勢待發,特斯拉 HW 3.0 的算力優勢已不復存在。為了保持領先,特斯拉 HW 4.0 確實應該露面了,現在開始準備的量產是非常合理的。
特斯拉 HW 4.0 會有多強大?我們先來看看它的競爭對手。
在今年9月,英偉達和高通前后腳發布了新一代車載計算芯片——英偉達 Thor 芯片和高通 Snapdragon Ride Flex 芯片。
它們不僅僅是自動駕駛芯片,而是真正的車載中央計算機,可以同時為智能駕駛、智能座艙、通信等能力提供計算支持。為了滿足多任務的需求,它們的算力達到了恐怖的 2000 TOPS(特斯拉 HW 3.0 的算力為 144 TOPS)。
英偉達的新一代汽車芯片算力飆升至 2000 TOPS
特斯拉 HW 4.0 會采用同樣的設計思路和性能指標嗎?
我不這么認為。
首先,在需求方面,特斯拉不需要 2000TOPS 這么高的算力。
此前業界普遍認為 500-1000TOPS 的算力足以支持 L5 級自動駕駛,而智能座艙的算力需求不到 100TOPS。即使以后算力需求會越來越大,特斯拉也用不了 2000 TOPS。我相信馬斯克不會為了“算力第一”的虛名去給工程師下命令,他只會在發布會上怒噴同行根本不懂自動駕駛,只會堆砌算力。
其次,在成本控制方面,特斯拉目前不支持車載中央計算機。
特斯拉是一家很務實的企業,非常重視規模效應和成本控制。
特斯拉此前發布了用于訓練自動駕駛算法的 Dojo 超級計算機,每個訓練模塊集成了 25顆全新研發的 D1 芯片,雖然性能先進,但是工藝復雜、產量較小,所以成本是非常高的。
特斯拉 Dojo 超級計算機將有可能成為最強大的超級計算機。
它由成百上千個訓練模塊構成,每個訓練模塊集成了 25 個 D1 芯片。
基于成本的考慮,在 D1 芯片的基礎上開發 HW 4.0 是很有可能的(恰好 D1 芯片和 HW 4.0 都是由臺積電生產的)。實際上,這也是業界常見的做法,比如英偉達的 Orin 自動駕駛芯片和 A100 數據中心芯片都采用了安培架構。不過,這種方案恐怕就難以集成智能座艙芯片了。
另一方面,目前特斯拉的智能座艙芯片是來自 AMD 的 Ryzen,這款消費級的芯片性能強大,而且價格比較便宜。而特斯拉在 GPU 方面缺乏積累,去開發一款智能座艙芯片完全是費力不討好。
結語
一款芯片從開發完成到投入量產,大概需要 6-9個 月的時間。臺積電今年訂單不飽和,所以 HW 4.0 的進度應該還會加快。在 2023 年的特斯拉 AI Day 上我們應該就能一睹 HW 4.0 的真容了,相信它會再一次震驚業界。
更多精彩原創內容請關注微信公眾號:智能車指北