編輯部 整理自 MEET 2021量子位 報導 | 公眾號 QbitAI
當下,AI晶片將迎來什麼樣的挑戰?
隨著軟體步入「2.0時代」,數據開始驅動AI進化,算力也逐漸成為智能化的基石。
但除了晶片本身的算力提升,AI算法對晶片的要求,也還會越來越高。
一方面,AI算法的發展日新月異,從人工設計特徵,到深度學習神經網絡模型,發展速度已經遠超AI硬體改進的速度。
另一方面,軟體2.0時代,靈活的AI開發、有效的數據閉環,將成為AI系統的新特徵,這又會對AI晶片提出更多要求。
前後浪潮,一同夾擊。AI晶片,應當如何破圈?
在MEET 2021智能未來大會現場,地平線聯合創始人兼技術副總裁黃暢,給我們分享了對於AI晶片行業發展的思考。
在不改變原意的基礎上,量子位對黃暢的演講內容進行了編輯整理。
關於MEET 智能未來大會:MEET大會是由量子位主辦的智能科技領域頂級商業峰會,致力於探討前沿科技技術的落地與行業應用。本次大會現場有李開復等20餘位行業頂級大咖分享,500餘名行業觀眾參與,超過150萬網友在線收看直播。包括新華社、搜狐科技、澎湃新聞、封面新聞等數十家主流媒體在內紛紛報導,線上總曝光量累計超過2000萬。
演講要點
AI的核心理念,就是不斷地用機器替代人做更多的事情,包括學習本身。「軟體2.0」,指的是將整套AI系統的開發、測試、改進、安全評估,放在真實的物理世界中迭代提升,形成一個數據迭代閉環。如今,圖像識別算法的進化速度,甚至已超過半導體行業的摩爾定律。即使功耗再低、面積再小,晶片也不能沒有性能。而晶片的運算能力指標(TOPS),並不能反映最先進的算法帶來的性能提升。因此,地平線提出了一個新指標MAPS,來合理地評估計算性能。只有將最先進的算法、和最先進的處理器架構結合在一起,才能更好地對算法進行優化。車載AI晶片,不僅是智能汽車的數字發動機,也是整個晶片行業的珠穆朗瑪峰。(以下為黃暢演講分享全文)飛速演進的AI算法自上世紀60年代被提出後,AI經歷了幾個發展階段。從早期的符號主義、基於規則的專家系統,到後來的人工設計特徵、淺層學習,再到今天的深度學習、超越深度學習的新範式……每個發展階段中,AI的核心理念,都是不斷地用機器替代人做更多的事情,包括學習本身。但與其他領域不同,AI涉及的問題,難以用分解簡化。以計算機視覺為例。在我們看來,下圖是一隻貓;但對於計算機而言,它只是一堆數據。
如何讓計算機理解這張圖,是一個複雜、高度非線性的問題。上世紀80~90年代,計算機視覺的先驅,曾提出一種場景理解框架:用計算機提取圖片中的物體邊緣、構造2D物體,並理解2D物體之間的深度關係(2.5D信息),以獲得3D模型。
但這個框架過於理想化。不僅在框架計算時會引入大量不確定性(錯誤、噪音),輸入圖像本身也存在物體尺度變化、流水遮擋、同類物體類內差異等問題。
而且,現實場景下存在大量光源,各種光會從不同角度、位置出發,在空間中發生反射、折射等變換。但計算機,卻無法逆向還原這一過程。伴隨著AI發展進入下一階段,專家們開始嘗試設計一些簡單特徵(如SIFT、HOG等特徵)。這些特徵,通常用於描述邊緣、紋理等信息。
然後,計算機會用機器學習中的淺層學習(如SVM、隨機森林等)模型來處理特徵。這些模型的參數不多,通常只經過2~3層非線性變化。
十幾年前,隨著稀疏編碼(Sparse Coding)出現,這條路走到了極致。這種方法基於無監督學習,將特徵表達從低維映射到高維,並在高維稀疏空間中,用線性方法進行圖像分類。儘管參數很多,但稀疏編碼並非端到端學習模式,仍屬於淺層應用框架。因此,它的提升空間非常有限。2012年,深度學習開始在計算機視覺領域「一飛沖天」。
隨著深度學習的發展,各種AI模型的運算效率變得更高。如果配合上特定的硬體設計,還能很好地擴大模型的容量、提升模型識別精度。早期的深度學習網絡,仍然由專家設計。但後來,研究者們開始讓AI自主發現能提取最優關鍵特徵的網絡架構、構造神經網絡。這期間,AI模型變得更加多樣化,算法也在不斷進步,其速度甚至超過了半導體行業的摩爾定律。過去8~10年裡,處理器性能大約每隔18個月翻倍,但在保持精度相同的前提下,算法的計算量每隔10~14個月就能減半。如今,只需要幾百分之一的計算量,AI算法就能達到8年前圖像識別的精度。相比於傳統方法(下圖黑線)會導致精度飽和,深度學習(下圖紅線)的優勢在於,它能很好地利用大數據、大模型和大計算量,來提升模型精度。
但與AlphaGo不同,基於深度學習的AI系統不能只建立在模擬器中。以地平線從事的自動駕駛行業為例。相比於虛擬世界,自動駕駛所應用的真實物理世界(像動植物、自然氣候等)在不斷發展變化、並持續湧現出新的任務和邊角案例(corner case)。因此,我們不能只在「虛擬世界」(如模擬器)中,訓練端到端算法(感知、預測、規劃、決策)、再將它們部署到汽車上。我們必須將整套AI系統的開發、測試、改進、安全評估,放在真實的物理世界中迭代提升,形成一個數據迭代閉環。這,便是所謂的「軟體2.0」。軟體2.0時代,AI晶片新指標軟體2.0開發系統,是目前可行度最高的大規模持續迭代AI系統。
這個AI系統建立於自動化平臺上,通過構造一個完整的數據閉環,來快速提取物理世界的數據。然後,將數據送入後端訓練、迭代模型,以提升系統的精度與效率,再通過OTA更新前端模型。這是一個包含數據和計算系統在內的、非常完整的體系。那麼,這個數據閉環長什麼樣?如下圖,傳統的「數據標註→訓練→評測」,只是其中的一個小閉環,裡面的數據是「死」的。
真正的大數據閉環,實際上包含這一訓練模型,它會通過OTA伺服器,將模型部署到機器人端(如自動駕駛車輛)。然後,再由機器人端採集數據,並通過數據挖掘送到閉環數據系統,進行快速迭代。這樣的「小閉環+大閉環」,構成了整個「軟體2.0」的開發系統。這些年來,我們的軟體算法演進速度很快。但算法的演進速度,是以巧妙的算法設計為代價的。算法越巧妙,對計算架構的要求就更高。像傳統的通用並行計算架構GPU,已經無法滿足目前先進AI算法的需求,因為它的整體計算效率,其實相當低下。舉個例子,下面是用運算能力(TOPS)達每秒30萬億次的處理器系統,運行各種算法任務的結果。
理想情況下,系統的算力利用率,應該能達到100%;但實際上,算力利用率普遍只有5%~60%。精度相同時,算法計算量越小,計算效率通常也越低。因此,處理器的架構設計非常重要。架構設計得越合理,算法運行就越高效。為了合理地評估計算性能,地平線提出了一個新指標MAPS(Mean Accuracy-guaranteed Processing Speed,在精度有保障範圍內的平均處理速度)。為什麼要提出這個新的指標?事實上,晶片的評估,往往有三個指標(PPA):性能(Performance)、功耗(Power)、面積(Area)。其中,功耗和面積分別決定了晶片的使用、製造成本,但無論功耗再低、面積再小,晶片都不能沒有性能。然而運算能力(TOPS)指標,並不能反映最先進算法帶來的性能提升。因此,我們定義了MAPS,這個指標通過可視化和量化的方式,在合理的精度範圍內,以「快」和「準」兩個維度,評估晶片對數據的平均處理速度。例如,在不同晶片上對ImageNet數據集進行圖像分類。首先,選擇適合晶片的算法,然後從「快」和「準」兩個維度,對晶片的速度和精度進行評估。
上圖的三條曲線,就對應了三顆不同晶片的物體識別效果。這三顆晶片,分別是地平線第三代處理器、第五代處理器和英偉達Xavier晶片。對比發現,在圖像分類中,地平線第三代處理器只需要8%的功耗,就能達到英偉達50%的性能;第五代晶片只需要50%的功耗,就能達到英偉達500%的性能。在目標檢測中,第五代處理器同樣用50%的功耗,就達到了英偉達13倍的性能。
如果只沿用通用計算架構,很難為先進算法做出優化。只有將最先進的算法、和最先進的處理器架構設計結合,才能在功耗和性能上同時達到最優。在軟體2.0時代,算力的重要性不言而喻,尤其是領域相關的算力,而非通用算力。如果對領域相關的算力進行評估,一個更合理的指標就是MAPS。從這一指標來看,地平線設計晶片的功耗和性能,要比通用設計晶片的優勢更大。在鑽研AI晶片技術的過程中,我們也發現一個很有趣的現象。一方面,我們在不斷提高AI技術;另一方面,AI技術也改進了我們的生產製造。以晶片設計為例,普通工程師進行電路連線需要6周,但AI只需要6小時。
事實上,AI技術的出現,給晶片設計帶來了巨大挑戰。AI任務要求,晶片除了算力、還必須攜帶大量計算和存儲單元,即對存儲帶寬提出了更高要求。反之,AI技術,也在快速推動AI晶片的發展。車載AI晶片,行業的珠穆朗瑪峰地平線渴望萬物智能的時代,在我們看來,汽車終將成為四個輪子上的超級計算機。而車載AI晶片,不僅是智能汽車的數字發動機,也是整個晶片行業的珠穆朗瑪峰,其設計難度和質量要求(車規級)都很高。地平線的定位是Tier2,為產業賦能。我們既能供應晶片,也能提供完整方案,同時,還可以開放工具鏈,提供算法、模型樣例,進行專業化的培訓服務。
今年,地平線開啟了前裝量產元年。地平線車規級晶片「徵程2」,目前出貨量已突破10萬,還籤下了20多個前裝定點項目。目前,全球僅有三家公司,實現了車規級AI晶片規模化量產,地平線就是其中一家,也是國內唯一一家實現車規級AI晶片大規模量產的企業。而長安UNI-T和奇瑞螞蟻,也已經率先採用地平線的晶片,用作智能駕艙和高級別輔助駕駛。今年3月,「徵程2」在長安UNI-T上實現前裝量產;9月,奇瑞螞蟻搭載「徵程2」正式上市,實現L2+級自動駕駛。
從自動駕駛到智能座艙,汽車智能化的大潮即將湧來,勢不可當。我們希望通過努力去賦能百業,讓我們的客戶和用戶,都能享受到AI帶來的收益。同時,我們也願意與更多夥伴一起踏上這一徵程。謝謝大家!