特斯拉使用人工智能改進自動駕駛
特斯拉(Tesla)在上周的投資者會議上表示,一旦Dojo超級計算機加入其高性能計算基礎(chǔ)設(shè)施,特斯拉的自動駕駛能力將顯著提高。
特斯拉Autopilot軟件總監(jiān)Ashok Elluswamy在投資者日會議上發(fā)表演講時表示,運行FSD(全自動駕駛)軟件的特斯拉汽車(目前約有40萬客戶)將能夠通過硬件升級做出更智能的自動駕駛決策,這將提高整體人工智能(AI)能力。
該公司目前擁有一個人工智能系統(tǒng),實時收集車上八個攝像頭的視覺數(shù)據(jù),并生成一個3D輸出,識別障礙物及其運動、車輛、道路和交通信號燈,并對幫助汽車做出決策的任務(wù)進行建模。
特斯拉挖掘其汽車網(wǎng)絡(luò)以獲取更多的視覺數(shù)據(jù),并將其輸入到訓(xùn)練模型中。訓(xùn)練模型不斷學(xué)習(xí)以解決新的問題,有助于AI更好地理解路上的模式。通過FSD軟件升級,新的知識被輸入到汽車中。
“如果我們運行并重復(fù)這個過程,它會越來越好。”Elluswamy說,“可擴展FSD的解決方案是讓架構(gòu)、數(shù)據(jù)和計算變得恰到好處,我們已經(jīng)組建了一個世界級的團隊來執(zhí)行這項工作。他們正在將這三項工作推向前沿。”
FSD并非一帆風(fēng)順,軟件故障迫使特斯拉召回了36萬多輛汽車。該公司通過無線更新提供了軟件修復(fù)。特斯拉客戶可以從每月99美元開始購買FSD。一些使用舊款特斯拉車型的客戶還需要額外付費安裝FSD電腦。Elluswamy聲稱,有FSD的特斯拉仍然比美國全國平均水平安全高五到六倍。
Elluswamy說:“隨著我們提高系統(tǒng)的安全性、可靠性和舒適性,他們可以解鎖無人駕駛操作,從而將汽車的使用方式更新并超越目前的使用方式。”
如今,該公司在其數(shù)據(jù)中心的14000個GPU上運行其人工智能系統(tǒng),并可以利用30 PB的視頻緩存,而視頻緩存正在增長到200 PB。約4000個GPU用于自動標(biāo)記,其余10000個GPU用于人工智能的數(shù)據(jù)訓(xùn)練。
Elluswamy說:“一旦我們將Dojo(我們的訓(xùn)練計算機)引入這一領(lǐng)域,所有這些都將顯著增加。”
Dojo系統(tǒng)基于特斯拉自主研發(fā)的D1芯片,可提供22.6萬億次的FP32性能。它擁有500億個晶體管和10TBps的片上帶寬,以及4TBps的片外帶寬。
一組D1芯片將安裝在高密度ExaPOD機柜中,它將提供1.1 EB的BFP16和CFP8性能。特斯拉的車載FSB計算機可以提供150萬億次的性能,主要用于推理。
特斯拉硬件高級主管Ganesh Venkataraman在去年的Hot Chips大會上發(fā)表演講時表示,特斯拉之所以制造D1芯片,是因為在GPU和CPU擴展方面存在缺陷。
Venkataraman說:“我們注意到了許多瓶頸。首先是在推理方面,這是我們做FSD計算機的原因。然后我們開始注意到類似的訓(xùn)練規(guī)模問題,了解工作量后……我們可以根據(jù)輸出需求優(yōu)化我們的系統(tǒng)。”
在早期,特斯拉的人工智能系統(tǒng)依賴于單攝像頭和單幀視頻,然后在自動汽車規(guī)劃系統(tǒng)的后期處理中進行拼接。
“這是非常脆弱的,并沒有帶來顯著成功,”Elluswamy說。
在過去幾年中,特斯拉已經(jīng)轉(zhuǎn)變?yōu)橐粋€“多攝像頭視頻世界”。每輛車都有八個攝像頭,將視覺信息輸入AI系統(tǒng),然后生成一個3D輸出空間。人工智能對障礙物的存在、它們的運動、車道、道路和交通燈等做出決定。
任務(wù)建模超越了計算機視覺,并使用了ChatGPT等人工智能系統(tǒng)中使用的技術(shù),包括轉(zhuǎn)換器(Transformers)、注意力模塊(attention modules)和令牌(Token)的自回歸建模。
Elluswamy說:“有了這樣一個端到端的解決感知的系統(tǒng),我們真的去除了脆弱的后處理步驟,為規(guī)劃系統(tǒng)提供了高質(zhì)量的輸出。即使是規(guī)劃系統(tǒng)也沒有一成不變。它現(xiàn)在開始使用越來越多的人工智能系統(tǒng)來解決這個問題。”
自動駕駛汽車需要快速響應(yīng),以便實時做出平穩(wěn)、安全的決策。Elluswamy舉了一個50毫秒響應(yīng)時間的例子,自動駕駛汽車可以在與周圍環(huán)境(包括行人、紅綠燈)交互后做出駕駛決定。
這是大量數(shù)據(jù),而在傳統(tǒng)計算中,“每項數(shù)據(jù)都需要10毫秒的計算時間,很容易就超過了1000毫秒。這是不可接受的。”Elluswamy說,“但使用AI,我們將所有這些都打包成了50毫秒的計算量,這樣它就可以實時運行。”
特斯拉正在通過收集世界各地不同路況和交通趨勢的汽車數(shù)據(jù)來擴充其原始數(shù)據(jù)。特斯拉使用算法重建車道、道路邊界、路緣、人行橫道和其他圖像,然后將其作為幫助汽車導(dǎo)航的基礎(chǔ)。
Elluswamy說:“這是通過收集車隊中不同汽車的各種片段,并將所有片段組合成汽車周圍世界的統(tǒng)一表示來實現(xiàn)的。”
隨著更多數(shù)據(jù)被輸入到系統(tǒng)中,訓(xùn)練模型被不斷地重構(gòu)。為了訓(xùn)練網(wǎng)絡(luò),特斯拉在收集的數(shù)據(jù)上建立了一個復(fù)雜的自動標(biāo)記管道,在該管道上運行計算算法,然后生成標(biāo)簽來訓(xùn)練這些網(wǎng)絡(luò)。
Elluswamy說:“一旦我們完成了基礎(chǔ)重建,我們就可以在基礎(chǔ)上構(gòu)建各種模擬,以產(chǎn)生無限多樣的數(shù)據(jù)進行訓(xùn)練。”特斯拉擁有強大的模擬器,可以合成對抗性天氣、照明條件,甚至其他物體的運動。“每次我們添加數(shù)據(jù)時,性能都會提高。”