Dojo 超算上馬,特斯拉挑戰視覺極限

2021-01-19 魔法工坊

本文首發於微信公眾號新車一講

通過算法的迭代,自動駕駛汽車能否從 SAE L2 級輔助駕駛逐步發展到 L4 級自動駕駛?

2015 年 6 月,Google 無人車項目(Waymo 前身) CTO Chris Urmson 的答案是:NO.

「(從 L2 過渡至 L4)就像你努力練習彈跳,期望有一天學會飛翔一樣不現實」。

在同一時期,特斯拉 CEO Elon Musk 選擇踏上這條「不歸路」。

全車 8 顆攝像頭、自主研發 FSD 自動駕駛晶片、團隊的多次重組、超級計算機 Dojo 上馬……因為堅持 360° 視覺感知,特斯拉自動駕駛技術路線永久性地偏離了行業的主流趨勢,走上了一條獨特的道路。

從 2015 年到 2020 年,特斯拉的視覺感知進階之路,我們一起回顧。

8 顆攝像頭

2015 年 10 月 14 日,特斯拉召開 Tesla OS v7.0 系統更新發布會。那早已不是特斯拉的第一次系統更新,Elon 專門召開發布會,是因為這是特斯拉歷史上首次推送更新,啟用 Autopilot 輔助駕駛系統。

△ 第一版 Autopilot 可視化

這是特斯拉乃至智能駕駛行業的標誌性事件。

Elon 在發布會上說,每一位 Model S 車主(Model X 尚未交付,Model 3 尚未發布)都是培訓專家(expert trainer),特斯拉將通過系統收集各地道路上的路測數據,訓練 Autopilot的算法,並通過整車 OTA 更新,使 Autopilot 系統的魯棒性越來越好。

不過,這場發布會遠沒有一個月後的一個新消息重磅。

11 月 3 日,特斯拉在智能駕駛領域的核心盟友,Mobileye CEO Ziv Aviram 在其財報會議上洩露了 Autopilot 2.0 的硬體架構:

我們正在與一家車企合作,這是汽車行業歷史上第一款搭載 8 顆攝像頭的汽車,除了前置三目攝像頭,車身周圍還有 4 顆攝像頭,以及 1 顆後置攝像頭,加上 1 個毫米波雷達和車身周圍的超聲波傳感器。該系統將基於 5 塊 Mobileye EyeQ3 晶片組成的計算平臺運行。

Ziv Aviram 拒絕透露這家車企的名字,但在幾天後的另一場公開會議上,他提到特斯拉比其他任何車企都更快、更激進地挑戰技術的極限(Tesla is willing to push the envelope faster and more aggressively than any other OEM),並暗示新系統有望於一年內上市。

這等同於官宣了特斯拉 Autopilot 2.0 硬體車型將於 2016 年實現量產,也側面說明在技術高速迭代的 2016 年,Autopilot 1.0 硬體從投產第一天起就是「炮灰」屬性的存在。

當然,後來我們並沒有見到所謂「基於 5 塊 Mobileye EyeQ3 晶片組成的計算平臺」。

2016 年 5 月,特斯拉 Model S 車主 Joshua Brown 啟動 Autopilot 後打開 DVD 看起了《哈利·波特》。Autopilot 和 Joshua Brown 都沒能「看見」正在橫穿的白色半掛,Joshua Brown 在事故中身亡。

△ 史上首起誤用 Autopilot 致死

這起事故直接導致了特斯拉與 Mobileye 的公開對峙,最終,汽車行業對視覺感知信仰最深的兩家公司選擇了分道揚鑣。而特斯拉 Autopilot 硬體 2.0 測試版中 5 個 EyeQ3 晶片組成的計算平臺,也被來自英偉達的 Drive PX2 平臺所取代。

FSD 晶片

2016 年 10 月,「炮灰」屬性的 Autopilot 1.0 硬體車型在投產剛滿兩年就面臨退市——這一時間段遠低於汽車行業平均七年一換代的產品周期。

特斯拉宣布,以 8 顆攝像頭、英偉達 Drive PX2 計算平臺為標誌的 Autopilot 2.0 車型正式量產。

與此同時,特斯拉推出了備受爭議的、汽車行業歷史上第一個自動駕駛(Full Self-Driving)選裝包。

人們都以為,Autopilot 2.0 硬體會在未來幾年內大放異彩,直至 Autopilot 實現自動駕駛。但 Elon 非常清楚 8 顆攝像頭對算力的龐大需求,英偉達的 Drive PX2,無非是「炮灰 2.0」。

2015 年 9 月,從 AMD 離職的晶片大神 Jim Keller 面臨兩個抉擇:一,加入三星奧斯汀半導體公司,領導三星手機 SoC 的開發;二,創辦一家 AI 晶片公司,專注於垂直場景的應用。

最終,一個更有吸引力的職位否決了上述兩個選項:2015 年 12 月,Elon 親自找到 Jim Keller,說服他加入特斯拉,負責特斯拉自動駕駛晶片的研發。

2019 年 4 月,特斯拉召開自動駕駛投資者日,宣布搭載 FSD 自動駕駛晶片的 Autopilot 3.0 硬體正式量產裝車。

FSD 自動駕駛晶片在特斯拉 Autopilot 發展歷程中有著重要意義。

統領 FSD 晶片研發的 Autopilot 硬體工程副總裁 Pete Bannon 說過:FSD 晶片項目最大的特點就是「只有一個客戶特斯拉」。

在去年發布會後的問答環節,Elon 在評價特斯拉晶片合作夥伴英偉達時表達了類似的觀點:英偉達是一家偉大的公司,但他們有許多客戶,不得不做一個通用的晶片解決方案。

大多數人無法理解「只有一個客戶特斯拉」的重要性。Fortune 曾報導過 Jim Keller 在特斯拉時期的晶片設計思路:1. 深刻理解特斯拉 Autopilot 的軟體運行機理;2. 縮減或砍去通用晶片(例如,英偉達晶片)中與特斯拉軟體無關的模塊。

因此,大幅提升性能的同時降低能耗的秘訣在於晶片設計過程中的取捨。相比「取」,「舍」的意義更為重要。

最終,架構設計變得彌足精確,異構設計執行並行計算的 NPU 佔據了 SoC 中最大的物理面積,方寸之間,錙銖必較。

每一塊 FSD 計算平臺上都搭載了兩塊完全一致的晶片,每塊晶片的算力為 72 Tops,而前代英偉達 Drive PX2 平臺的算力為 8 - 10 Tops。與此同時,Drive PX2 的能耗為 57W,而特斯拉 NPU 的能耗為 15W。

用 Pete Bannon 的話說,他將近 40 年的晶片工程生涯裡從未見過新一代晶片性能提升超過 3 倍的,而特斯拉提升了 20 倍(圖像幀幅 HW 2.0 110 幀 VS HW 3.0 2300 幀)。

特斯拉通過將 SoC 設計、電源設計、信號完整性設計、封裝設計、系統軟體、電路板設計、固件及系統驗證等多個團隊垂直整合、研發流程並行推進,最終用 36 個月實現了從第一名員工入職到晶片全面裝車上市的完整流程。

「運營假期」

2020 年 9 月 11 日,通用汽車旗下自動駕駛公司 Cruise 發文介紹了一種叫做「持續學習機(Continuous Learning Machine)」的深度學習基礎設施。

簡單來說,「持續學習機」結合了支持自動標註數據的自監督學習框架和主動學習數據挖掘的框架。

Cruise 自動駕駛汽車通過主動學習,自動識別系統感知錯誤的極端場景,並將其加入到 Cruise 訓練數據集中。自監督學習框架支持自動標註數據,大幅降低標註成本,提升深度神經網絡的迭代速度。

通過「持續學習機」,Cruise 實現了深度學習基礎架構各種費時費力環節的高度自動化,讓持續學習機真正做到持續學習,而無需人工幹預。

等等,在 2020 年之前的年份,比如 2017 年,Cruise 是怎麼做算法訓練的?

算法的迭代離不開大數據的訓練。在此之前,機器學習算法訓練應用的主流方法,叫監督學習。

所謂監督學習,指的是數據在給到算法訓練前,需要先經過人工標註。(舉例:人工標註最基礎的部分就是畫框,對圖片上的機動車、非機動車、行人、紅綠燈等用不同形狀的框標註出來)。

△ 人工標註

這是人工智慧行業快速發展進程中的一個隱秘江湖——根據新華社 2019 年 9 月 10 日的報導,僅北京一座城市就有 100 多家專門從事數據標註的公司,全國有超過 1000 萬人在從事數據標註工作。

這也是一向頭頂高精尖光環的人工智慧技術卻又被揶揄「數字富士康」、「勞動密集型產業」的主要原因。

2017 年的 Cruise,和絕大多數企業類似,通過以監督學習為主的開發流程來推進感知算法的迭代。

在同一年裡,OpenAI 研究科學家Andrej Karpathy 加入特斯拉,擔任特斯拉 AI 總監。在他的社交平臺簡介裡,Andrej 寫道:我喜歡在大型數據集上訓練深度神經網絡。

擺在他面前的是一個如此規模的資料庫:截至 2016 年 10 月,Autopilot 累計運行裡程達到 2.22 億英裡,而同期的 Cruise 自動駕駛路測裡程為 13 萬英裡。

特斯拉和 Cruise 之間巨大的「數字鴻溝」決定了,從第一天起,特斯拉就無法基於傳統的人海戰術做數據標註,來進行算法的迭代——天文數字的人工標註成本會完全拖垮 Autopilot / FSD 的商業模式。

2019 年 11 月,Andrej Karpathy 介紹了特斯拉的名為「運營假期」數據流自動化計劃。不出意外,特斯拉應用了自監督學習框架,與通用 Cruise 如出一轍。

所謂自監督學習,是指用於算法訓練的不再是傳統意義上人工做好標註的訓練集,而是一組純粹的數據。通過對數據本身的特徵進行挖掘,從而實現感知算法的持續迭代。

不僅如此,2019 年,Cruise 團隊規模已經達到 1800 人,而 Autopilot 工程師團隊只有 300 人左右,Andrej 領導的人工智慧全棧團隊更是只有 30 人。

這使得 Autopilot 團隊採取更激進的數據流自動化:

我們正在使許多工作流程自動化,不僅涉及神經網絡訓練本身,還涉及 Ta 周圍的一切。we are automating alot of the work flows is not just about the neural network training itself, but everything surrounding that.

特斯拉人工智慧團隊的主要精力放在算法運行環境及流程自動化的建設、算法的校準、評估和持續集成,而非算法本身的開發上。

而特斯拉數據流自動化的終極目標,就是本節的標題:「運營假期」。

當一切都開發到理想形態時,自動駕駛系統應該自動完成進化,全程無需人為幹預。所以人工智慧團隊在項目運營的時候可以去休假(因為無需幹預),這就是項目最理想的形態。

Dojo 超級計算機

Dojo 是特斯拉自動駕駛技術架構中最神秘的組件。每每到 Dojo 的環節,Elon 和 Andrej 總會以「我們還沒準備好談論它」搪塞過去。

很長一段時間裡,大眾對 Dojo 的認知僅限於「特斯拉用於雲端訓練的伺服器」。然而進入 2020 年,Elon 開始在 Twitter 持續公布 Dojo 的信息,最終為大眾勾勒出了 Dojo 基本的輪廓。

簡單來說,Dojo 是特斯拉用於雲端訓練的超級計算機,能夠處理大量的視頻訓練數據並有效運行帶有大量參數、大量內存和內核之間超高帶寬的超稀疏陣列。Dojo 支持對大量視頻進行無監督學習訓練。

根據 Elon 的說法,Dojo 基於 FPGA 可編程電路晶片打造,目前的開發進度只有 0.01%,特斯拉仍需要大約一年時間來實現 Dojo V1.0 版本的運行。挑戰不僅限於晶片,還包括複雜的供電與散熱問題。

為什麼 Elon 說 Dojo 是真正的變量呢?

在談論 Dojo 的峰值性能時,Elon 說了這麼一句話:

A truly usefulexaflop at de facto FP32.

一句話裡出現了兩個術語 exaflop 和 FP32,還夾雜著兩個拉丁語單詞 de facto,確實在在一定程度上擋住了媒體的廣泛傳播(猜測是 Elon 故意為之)。我們一一說來。

FP32 是單精度浮點格式,這是一種深度學習領域的主流格式,表示神經網絡中的權重、激活值和其他值。

相比 FP32,exaflop 是更重要的、極為典型的特斯拉式的話術。Exaflop 是一種浮點運算計量單位,表示 10 的 18 次方,即 1 exaflop 表示超級計算集群的運算速度可以達到百萬萬億次 / 秒。

所以,這句話的完整翻譯應該是:(運行格式為 FP32 的 Dojo)的峰值性能將支持以 exaflop 為單位計量。

為什麼說這是非常典型的特斯拉話術?

2013 年,特斯拉在內華達州 Reno 市郊區還是一片沙漠的時候,宣布將建設名為 Gigafactory 的超級電池工廠。

2019 年,在經過一系列密集儲備、收購快速提升電池產能的核心技術資產後,特斯拉又宣布下一座超級工廠將命名為 Terafactory。

這裡的 Giga 和 Tera 分別出自電功單位 GigaWatt-hours 和 TeraWatt-hours,兩個命名分別指以 100 萬千瓦時和 1 億千瓦時為產能單位的超級工廠。

建設 7 年後的 2020 年,特斯拉內華達州的 Gigafactory 年化產能達到 35 GWh / 年,成為全球產能最大的電池工廠。

那麼 Dojo 從零到真正以 exaflop 作為計量單位需要花多長時間?其實前面已經提到了:特斯拉需要大約一年時間來實現 Dojo V1.0 版本的運行。

放眼全球,以 exaflop 為計量單位的超級計算機處在什麼位置呢?以下是國際超級計算機大會(ISC)2020 年 6 月更新的全球超級計算機 Top 10 排行榜。

可以看到截至目前,全球尚未出現真正意義上的以 exaflop 為計量單位的超級計算機。排名第一的 Fugaku 峰值性能也僅為 0.415 exaflop。

相比 Elon 口中 Dojo 的超高性能,我們更應該關注的,也許是自動駕駛之於車企的意義。

再次回看前面的表格,排名前十的的超級計算機無一例外均由專業計算機製造商研發、由各國的國家實驗室所有。而他們的應用場景,也無外乎是中長期天氣預報、油氣勘探、物理模擬、量子力學等領域。

也就是說,在此之前,超級計算機的研發落地更多是各國國家意志的體現,普遍應用場景也都是那些商業公司無法有效解決的超大型計算場景。

特斯拉是首個由業務(自動駕駛)的超高算力需求倒逼研發,去製造世界級超級計算機的汽車製造商。

當自動駕駛進入汽車行業後,我們還能繼續將汽車行業視為以製造為基礎的輕工業嗎?沒有什麼比研發一臺超級計算機,更能說明汽車行業已經完全進化為代表一個國家前沿科研能力的高精尖行業。

最後的臨門一腳

在以 Dojo 超級計算機為主題的文章裡,我們為什麼要花超過一半的篇幅來鋪陳特斯拉的 8 顆攝像頭、FSD 自動駕駛晶片和數據流自動化開發流程?

一切的原點,都源於 2015 年的 8 顆攝像頭。2015 年 10 月,在特斯拉 v7.0 發布會 QA 環節,Elon 將特斯拉 Autopilot 部門未來五年計劃和盤託出:

(Autopilot 1.0 硬體)不是完整的自動駕駛傳感器系統,為了實現自動駕駛,顯然需要 360° 的視覺覆蓋,需要冗餘的前置攝像頭、冗餘的計算平臺、動力和轉向系統。

五年的時間,特斯拉 Autopilot 以這段話為行動綱領迭代了三個硬體版本。

「冗餘的動力和轉向系統」,加上尚需一年時間完備的 Dojo 超級計算機,特斯拉自動駕駛汽車還差最後的臨門一腳。

END

本文首發於微信公眾號新車一講

相關焦點

  • 翼裝飛行--挑戰極限運動的極限
    —有能量 任你肆翼飛翔  近期熱播的紅牛廣 告裡,男主角穿著蝙蝠衣從山頂縱深而下,這便是世界極限運動中的極限—「翼裝飛行」。翼裝飛行運動是目前不藉助機動裝置的情況下全球速度最快的體育運動,因此也被稱為「極限運動之最」,由於難度極大,危險性高,全球僅有百餘人參與該項運動。  刺激的極限運動  翼裝飛行,也叫近距離天際滑翔運動,誕生於上世紀90年代,由極限跳傘運動演變而來的。
  • 百度Mobileye 特斯拉,自動駕駛純視覺路線「復興」?_易車網
    在ApolloLite之外,業內比較知名的純視覺感知方案還有北美代表特斯拉的FSD和以色列代表Mobileye的SuperVision。如何看待純視覺路線與涵蓋攝像頭、毫米波雷達、雷射雷達在內的多傳感器融合路線呢?特斯拉、Mobileye和百度先從最先量產的特斯拉說起。
  • 東京特色繽紛系咖啡店:挑戰視覺與味覺極限
    有文具廠商Pentel推出的隨意塗鴉咖啡店「GINZA RAKUGAKI Cafe & Bar by Pentel」、也有極具特色的視覺系咖啡店「KAWAII MONSTER CAFE」,還有可以做色彩療法的咖啡店「ココロゴトカフェ」!想在繽紛的視覺享受中香醇的咖啡嗎?看小編這篇為大家整理了什麼吧!
  • 不要挑戰人的極限
    清風徐來歲月香2020-11-19 10:04:49原創 徳耀天地 德耀守望 今天彈簧繃緊了會斷,斷裂了就無法再接;彈簧超過極限就永遠失去了彈性。萬事萬物的承受力都是有一定限度的,千萬不要去挑戰各種極限。
  • 新服裝爆料丨極限特訓現在開啟,挑戰你的實力極限!
    穿上極限特訓時裝,背好極限特訓降落傘,和我一起極限空降吧!追求極限相信是每位特種兵的目標。但是想要在遊戲中真正展現出完成極限特訓歸來的酷炫還需要不斷的努力哦~於是我為大家設想了一個計劃,那就是高級遴選特訓「地獄周」。
  • 極限挑戰3林更新帽子什麼牌子 極限挑戰林更新同款棒球棒
    極限挑戰最新一期中,宇文玥林更新單獨來了,楚喬趙麗穎沒來,簡直不開心,那麼極限挑戰林更新帽子什麼牌子?下面和小編一起看看吧。  極限挑戰林更新帽子什麼牌子  第三季《極限挑戰》,在佛山錄製的第二期以及在香港錄製的第三期,雖然兩位嘉賓沙溢和黃宗澤都很搶眼,但這兩期節目均遭到了網友的吐槽。
  • 極限挑戰第三季第十一期插曲 極限挑戰3所有背景音樂匯總
    昨晚,東方衛視《極限挑戰第三季》播出第十一期的內容,上周五極限挑戰終於復播。簡直開心至極吧!那麼極限挑戰第三季第十一期插曲有哪些?極限挑戰第三季第十一期背景音樂?一起來看看吧!  極限挑戰第三季第十一期插曲有哪些?
  • 回顧《極限挑戰》,再次感受網友說的「真情實感」!
    #極限挑戰#一直以來大家都會說綜藝都是有劇本的,但是後來出了《極限挑戰》這一檔綜藝,大家都稱它,沒有劇本。《極限挑戰》給我們帶來的不僅是歡樂,還有很多感動。節目確實也有不少宣傳效果,也算推動經濟發展了。喜歡的觀眾還是可以回看一下的。喜歡這篇文章的記得「一鍵三連」呀~這對慕木真的很重要!
  • 「禁閉挑戰」:人體極限別「亂挑戰」
    「禁閉挑戰」不僅讓人覺得是譁眾取寵,更可能損害到參與者的身心健康,難以讓人看到其積極意義。  近日,在網絡平臺上有多家公司舉辦「禁閉挑戰」,挑戰者須在沒有任何電子設備、無任何時間提示、與外界零接觸的房間內獨自生活30天。如果挑戰成功,就能獲得5萬到10萬不等的獎金。
  • 深圳交響樂團 「極限挑戰」
    深圳交響樂團2020-2021音樂季「匠心韶華」系列之「極限挑戰」音樂會將於15日在深圳音樂廳上演。在這場由國際指揮新星錢駿平執棒的音樂會,將奏響莫扎特《女人心》序曲、貝多芬《降E大調第五鋼琴協奏曲》和巴託克《樂隊協奏曲》。
  • 《決勝荒野之華夏秘境》收官,挑戰極限類綜藝如何決勝市場?
    類型綜藝的「荒野」與「決勝」《決勝荒野之華夏秘境》的熱播,將挑戰極限類節目再次推至大眾關注下。去年主打都市夜景追跑競技秀的《追我吧》以高以翔身亡的慘痛宣告永久性停播,以生命為代價的警鐘敲響,綜藝節目的高強度、高難度和高風險也一度成為敏感詞,挑戰極限類綜藝路向何方也成為市場關注的重點。
  • 極限挑戰3第六期背景音樂插曲匯總 極限挑戰第三季音樂大全
    《極限挑戰》第三季本周一期還是在三亞,只不過這是下集而已,上周播出到誰分數最低誰將被發配到荒島上,所以這一期是張藝興獨自在荒島吃晚餐,可憐兮兮!一起來看看極限挑戰第三季第六期插曲是什麼吧!  極限挑戰第三季第六期插曲是什麼?  本期節目也將延續第三季節目宗旨,以致敬「最可愛的人」為主題。
  • 極限挑戰第六季豆瓣4.3分!隨著張藝興退出,再也回不到過去了!
    極限挑戰曾經是我們每一年必看的綜藝節目,他沒有那麼的娛樂性,但是他們幾個人之間的感情以及節目的故事,讓我們是越來越喜歡這個節目了。後續隨著之前的總導演嚴敏的退出,以及常駐的他們幾個嘉賓退出,極限挑戰第五季的口碑就開始跌落了。
  • 挑戰自我技術的極限 《暗黑復仇者3》發售日確定
    挑戰自我技術的極限 《暗黑復仇者3》發售日確定 來源:www.18183.com作者:三隻魚時間:2018-06-09 分享到: 由Boolean Games開發、NEXON代理營運的《暗黑復仇者3》將於6月21日正式上線
  • 蔚來ET7是顛覆特斯拉還是PPT造車?
    而更大的衛星是ET7未來還有1500 kWh電池版本,多線雷射雷達,高清攝像頭和1016TOPS的算力。這些配置都是特斯拉望塵莫及的。 但是,蔚來ET7給出的是期貨,2022年才會交付,距離發布有一年的時間。
  • 「禁閉挑戰」?人體極限別「亂挑戰」
    ■戴先任   近日,在網絡平臺上有多家公司舉辦「禁閉挑戰」,挑戰者須在沒有任何電子設備、無任何時間提示、與外界零接觸的房間內獨自生活30天。如果挑戰成功,就能獲得5萬到10萬元不等的獎金。
  • 《極限挑戰》路透,張藝興為男人幫蹲地寫祝福,路邊吃軟糖超可愛
    《極限挑戰》是很多網友們每年必看的一檔綜藝節目。在前幾季節目中,男人幫之間所有聯合、背叛、反轉、再反轉的戲碼讓觀眾們的腎上腺素時刻激升,欲罷不能。在粉絲們心裡,男人幫和《極限挑戰》就是一個不可分割的整體,但可惜的是,2020年的新一季《極限挑戰》已經開錄,而男人幫卻湊不齊了。
  • PUMA X ADER ERROR 挑戰次世代新極限!
    知名運動品牌PUMA 旗下SELECT 系列再度聯手首爾韓流新寵潮牌ADER ERROR,以瞬息萬變的數位趨勢及創意無極限的次世代文化為靈感,將不斷推進的世界趨勢和突破創新極限視為挑戰,向節奏快速且深富前瞻開創的次世代族群致敬。
  • 西行紀:毘沙門天要挑戰極限,那他為何不去挑戰更強的三清?
    但真實情況是毘沙門天不可能到達自己的極限,也缺乏挑戰自己極限的意志,所以他要挑戰極限並在戰鬥中悟道無我的話其實只是一個騙局,一個用來欺騙自己的可笑藉口。挑戰自身極限並不局限於挑戰同級別的對手,越級挑戰更強之人能更快的達到自己的極限,然後超越極限。
  • 跳出舒適圈,挑戰極限
    而我們要做的是:跳出所謂的舒適圈,時刻保持危機感,多去學習,挑戰自己的能力極限。俗話說:「菩薩合掌念菩薩,求人不如求自己。」投資什麼都不如投資自己,多一樣本領,就可以減少求人的機會。只有自己足夠強大,才會有更多的人願意幫你。