人工智慧硬體應用場景歸納為雲端場景和終端場景兩大類。雲端主要指伺服器端,包括各種共有雲、私有雲、數據中心等業務範疇;終端主要指包括安防、車載、手機、音箱、機器人等各種應用在內的移動終端。由於算法效率和底層硬體選擇密切相關,「雲端」(伺服器端)和「終端」(產品端)場景對硬體的需求也不同。
核心晶片決定計算平臺的基礎架構和發展生態,由於AI所需的深度學習需要很高的內在並行度、大量浮點計算能力以及矩陣運算,基於CPU的傳統計算架構無法充分滿足人工智慧高性能並行計算(HPC)的需求,因此需要發展適合人工智慧架構的專屬晶片。
除CPU外,人工智慧目前主流使用三種專用核心晶片,分別是GPU,FPGA,ASIC。本報告分上下2部分仔細分析雲端和終端兩種應用場景下,這三種專屬AI晶片的應用現狀、發展前景及可能變革。上半部分《雲端場景:GPU生態領先,未來多晶片互補共存》詳見10月刊。
終端場景:按需求逐步落地,未來集成是趨勢
1 「下沉」終端,晶片負責推斷
雲端受限於延時和安全性,催生AI向終端下沉。雲端AI應用主要依靠網絡將雲端計算結果與終端執行結果數據和增量環境參數進行交換。這個過程存在兩個問題:第一,使用網絡傳輸數據到雲端會產生延遲,很可能數據計算的結果會需要等待數秒甚至數十秒才能傳回終端;第二,使用網絡傳送數據,傳輸過程中數據有被劫持的風險。因此,在某些對延遲和安全性要求較高的場景就有了將AI下沉到終端的需求。
下沉到終端的AI主要是「推斷」部分。由於模型更新快,計算更為複雜,且基於大數據,「訓練」一般在雲端進行。由於數據和算力限制,未來在終端場景下,處理器主要負責執行人工智慧的「推斷」過程。「推斷」下沉終端優勢在於實時性,可以在終端進行的操作不需要回傳雲端處理,更有效滿足AI運算的實時性需求場景。終端可定期從雲端下載訓練好的參數用於推斷參數更新,同時可選擇上傳雲端需要的「訓練」信息。通俗來說,未來終端人工智慧「大腦」的進化仍在雲端進行。
2 需求決定硬體,場景逐次落地
採用硬體實現終端人工智慧是必然。理論上,智能終端利用原有CPU大腦,運行純軟體的AI算法,也可實現相關應用。但實時性要求高的場景(如安防、輔助駕駛等),對「最差情況下的最大延時」容忍度很低,如果只用CPU運算不能滿足實時性要求,必須有專屬硬體加速;而在手機、音箱、AR/VR眼鏡、機器人等使用電池、對功耗敏感的終端場景,採用純軟體運算功耗很大,不能滿足用戶對功耗的苛刻要求,同樣需要採用專屬晶片加速。
終端AI推斷需要硬體支持的需求場景有三種:(1)低延時;(2)低功耗;(3)高算力。按照需求落地先後順序,我們判斷AI晶片落地的終端子行業分別是:(1)智能安防;(2)輔助駕駛;(3)手機/音箱/無人機/機器人等其他消費終端。三個領域對終端AI硬體的要求各有側重:(1)智能安防、智能駕駛由於視頻信號的數據量較大,對數據流計算速度要求較高;(2)智能駕駛除計算能力外對硬體的穩定性和突發狀況處理速度要求較高;(3)智慧型手機、音箱、AR/VR終端受限於電池容量,對低功耗的要求更高些。下面我們逐個分析幾種AI+場景。
2.1 終端落地之AI+安防:GPU和FPGA先發落地,未來主控集成ASIC
(1)智慧安防空間:AI產品持續滲透,長期千億市場空間
從「看得見」到「看得清」到「看得懂」,智能大數據分析需求迫切,AI+安防趨勢明顯。高清技術日益進步,圖像解析度從D1到720P、1080P再到4K逐步進階,視頻監控設備持續高畫質化升級換代。根據IHS數據,2013-2016年我國高清攝像機佔比由13%增長至59%,首次超過模擬攝像機,實現了視頻監控從「看得見」到「看得清」的轉變,滿足智能化基礎需求。攝像頭高畫質化產生海量數據,傳統的人工查看方式已不滿足日益增長的安防需求。同時,安防領域每年產生大量非結構化數據,將海量非結構化數據結構化後進行智能處理能極大提高追蹤效率,人工智慧的引入能滿足從事後追查到事前防範的安防根本需求。安防領域在實現高畫質化網絡化升級後,急切需要人工智慧技術對海量數據進行處理,這些都促使攝像頭目前開始向「看得懂」進化,智能安防趨勢明顯。
智慧安防產品首先在政府市場落地,長期千億市場空間。(1)短期而言:由於AI產品單價較高,且適用於處理遠距離的大數據,因此我們認為短期的增量空間主要看政府中的公安、交通等部門。假設國內/國外視頻監控行業增速分別為15%/10%,至2020年國內外視頻監控市場規模分別達1683/1234億元,保守估計,若AI產品滲透率提升至10%,則國內/國外AI產品市場空間分別為168/148億元。(2)長期來看:隨著性價比更高的晶片解決方推出,預計海思等主控廠商必然推出包含AI專屬TPU的IPC主控產品,以海康為首的安防廠商也必然研發推出適合自身的AI+晶片終端解決方案,AI產品單價將逐步回歸理性,智慧產品的滲透範圍有望快速滲透延伸至其他領域。未來AI產品滲透率若提升至35%,則全球AI產品市場空間將突破千億元。
(2)現有生態:GPU是目前AI+安防方案主流,行業巨頭與英偉達攜手
「AI+安防」方案兩種:前端方案是未來趨勢,中後端AI方案是目前主流。對智能安防而言,目前有前端和中後端兩種解決方案。前端方案是AI攝像頭方案,即將AI晶片集成至攝像頭中,實現視頻採集智能化;中後端方案則是利用普通攝像機採集視頻信息後傳輸到中後端,在數據存儲前利用插入GPU等板卡的智能伺服器進行匯總分析。由於中後端方案不需要更換攝像頭、可同時處理多路數據、部署成本相對較低,算法升級、運維方便,短期內中後端方案普及速更快。長期來看,海思等攝像頭主控晶片廠商必然在晶片內部集成用於AI計算的專屬硬體模塊,大規模應用後實現成本會急劇降低,前端(智能攝像頭)方案有望成為未來智能安防主流。目前無論是前端還是中後端解決方案,海康、大華等公司都採用英偉達GPU(Jetson TX1產品)實現,且以中後端AI方案為主。
安防巨頭緊密攜手英偉達,布局基於GPU的智能設備產品。目前海康、大華兩大安防巨頭的AI算法和相關產品都基於英偉達的GPU實現。2016年,海康威視推出從前端到後端全系列的AI產品,發布基於英偉達GPU和深度學習技術「深眸」攝像機、「超腦」NVR、「臉譜」人臉分析伺服器等多款AI系列產品。大華股份2016年第三季度成立AI研究院,2017年3月聯合英偉達發布多款「睿智」系列前端和後端智能設備。
海康威視:首提安防AI+,引領安防智能化發展。海康威視自2006年開始智能分析技術研發,2013年布局深度學習。憑藉多年深度學習研究積累以及高達9000餘人的業內最大研發團隊,公司在全球包括人臉識別、車輛識別、文字識別在內的多項圖像檢測比賽中取得第一。2015年公司率先推出AI中心產品「獵鷹」、「刀鋒」智能伺服器,2016年公司在安博會首提「安防AI+」概念,並與英偉達和Movidius達成合作,陸續推出基於GPU/VPU和深度學習技術的「深眸」、「超腦」、「神捕」、「臉譜」系列AI 前後端產品,並融入相關解決方案。公司AI產品目前已應用到南昌「天網項目二期」、「一帶一路」峰會安保等重大項目中,有望引領安防智能化發展。
大華股份:緊隨布局人工智慧,AI產品加速落地。大華從2015年開始人工智慧研究,在深度學習基礎上研發出人臉識別、視頻結構化、異常行為分析、高密度人群分析等智能技術。16年大華在向國際權威的人臉識別公開測試庫LFW 提交測試結果,Dahua-FaceImage人臉識別準確率為99.78%,保持世界第一水平。同期公司依託在CPU、DSP、GPU和FGPA等晶片平臺上多年積累的軟硬體研發能力,研發出包括前後端人臉識別、卡口電警、雙目立體視覺、多目全景拼接產品在內的一系列智能化產品。17年公司聯合英偉達發布多款「睿智」系列前端和後端智能設備並融入相關平安城市項目解決方案,大幅提高視頻數據利用率,推進大數據在安防領域加速落地。
(3)未來趨勢:基於GPU成本是痛點,未來集成至IPC主晶片是趨勢
目前基於GPU的智能安防的成本較為昂貴。目前主流的智能安防解決方案多基於英偉達Jetson TX1 GPU晶片,單個晶片成本估算在70~150美元左右,模塊成本在200~300美元。依據配置不同,每個晶片可支持2~4路視頻流,單路實現成本較高。相關調研顯示,海康威視或已獨家壟斷英偉達TX1的GPU晶片供貨。其他安防廠商僅可購買英偉達的TX1模組(即包括晶片、存儲的GPU板),採購成本會更高。基於GPU的智能安防解決方案較為昂貴,目前阻礙了智能安防的滲透率快速提升。
FPGA成當前智能安防降低成本的可能方案。智能安防領域,目前國內公司深鑑科技已和大華股份、東方網力等安防廠商展開合作,推出基於Xilinx FPGA 的DPU產品,可以實現相對於GPU有1個數量級的能效提升,同樣功耗降低80%。該方案可將AI單路成本控制在20美元以內,較GPU方案便宜。同時,另一家國內公司地平線機器人也嘗試將FPGA方案應用於安防和車載領域。在專用ASIC產品出現之前,FPGA有望成為部分安防場景降成本的有效手段。
ASIC未來將成為安防晶片主流。如前文所述,ASIC形態的AI晶片解決方案具備低成本、低功耗、高算力的優點。由於晶片存在大規模成本邊際效益遞減效應,專用晶片量產後,由AI模塊帶來的每顆晶片和相關存儲成本增加預計在2美元以下,採用ASIC方案的AI攝像頭實現成本將大幅度降低。換句話說,以後可能實現攝像頭在成本增加非常小的情況下就可以轉化成為AI攝像頭。我們預計,和手機晶片集成AI專屬模塊類似,華為海思等攝像頭主控晶片廠商,未來必然會集成適合安防場景的專屬AI模塊至主晶片中;同樣的,以海康為首的安防廠商,為優化自身解決方案,也有望自研或與相關晶片廠商合作開發其專屬的人工智慧專用晶片。伴隨著社會對智慧安防能力的需求提升,未來包含AI功能的ASIC主控晶片或將成為安防主流晶片。
2.2 終端落地之AI+汽車:GPU佔據主導,ASIC是未來趨勢
(1)智能駕駛空間:晶片百億市場空間
智能駕駛空間廣闊,ADAS晶片是核心。智能駕駛是集導航、環境感知、控制與決策、交互等多項功能於一體的綜合汽車智能系統,是人工智慧落地的重要領域之一。據iiMediaResearch估計,2016年全球智能駕駛汽車市場規模為40.0億美元,預計至2021年增長至70.3億美元,複合增長率11.8%。智能駕駛核心是高級駕駛輔助系統(ADAS),ADAS系統的核心是算法和晶片。根據IHS預測,2020年全球ADAS晶片市場空間將達到248億元,2016至2020年期間複合增長率高達10%。未來人工智慧在車載領域具備廣闊的市場空間。
(2)現有生態:巨頭與技術初創公司均大力布局AI+汽車
英偉達:2016年9月,Nvidia發布針對自動駕駛技術和汽車產品的晶片Xavier,採用自定義的八核CPU架構,內建全新Volta GPU架構作為自動駕駛汽車的計算機視覺加速器。Xavier採用16nm FinFET 工藝,在提升性能的同時降低功耗,Xavier運算性能達到20 TOPS,功耗則只需20瓦。英偉達在智能汽車領域的客戶包括21家汽車製造商,而且英偉達是其中16家的連接解決方案一級供應商。它在該領域最重要的客戶是特斯拉,英偉達的DRIVE PX 2平臺應用於特斯拉所有車輛的AutoPilot系統中,包括Model 3。
高通:高通作為移動終端處理器的優勢企業,在GMIC2016上發布智能汽車晶片驍龍820A。該處理器採用CPU+GPU模式,在快速處理數據信息的同時提升地圖的渲染效果,並降低處理器能耗。處理器包括64位Kryo CPU(中央處理器)、Adreno 530 GPU(圖形處理器)。
地平線:2016年3月奇點汽車發布會上,國內人工智慧公司地平線首次展示了其先進輔助駕駛系統(ADAS)原型系統—雨果平臺。從地平線官方的視頻和圖片資料來看,這套系統可以實時檢測車輛、車道線和行人,檢測效果優於NVDIA於2016年初CES上提供的展示效果。在2017年1月的CES上,地平線又攜手英特爾於全球消費電子展CES共同發布基於BPU架構的最新的高級輔助駕駛系統。在硬體方面,地平線將其BPU架構實現在ASIC上,併集成到雨果平臺上。地平線的第一代人工智慧處理器「盤古」已於2017年6月在臺積電流片。產業調研顯示,地平線也是目前唯一在四大汽車市場—美國、德國、日本和中國,與頂級OEMs和Tier1s 建立重要客戶關係的中國初創企業。中國中央電視臺,美國MIT Technology Review等眾多媒體報導了地平線在自動駕駛和人工智慧處理器設計方面的進展。
(3)未來趨勢:專屬ASIC晶片是未來智能汽車市場主流
我們判斷,專屬ASIC晶片是智能汽車市場未來主流。得益於ASIC優良的性能,定製晶片可將車載信息的數據處理速度提升更快,並將能耗維持在相對較低水平,最重要的是,ASIC可以更好的滿足車載應用下重點關心的「最差情況處理」的延時問題。但鑑於其研發周期長且成本高昂,目前車載場景下,主流廠商仍然考慮採用GPU作為主流方案,預計隨著ADAS定製化需求的增加,未來專用晶片將成為主流。
2.3 終端落地之AI+消費電子:百花齊放的未來最大應用場景
(1)智慧產品空間:千億美元市場,AI或引領新一輪消費電子革命
ASIC將成為AI終端之消費電子的必然選擇。在過去的20年,主導消費電子的終端應用從PC切換到智慧型手機,然而蘋果發布iPhone已有十年,全球智慧型手機滲透率已近飽和。據Gartner預測,2016~2019年PC出貨將出現負增長,而智慧型手機的出貨增速僅維持在1~2%。因此從2015年以後,大家開始尋找消費電子行業下一個風口,紛紛開始關注無人機、AR/VR、智能音響等領域。此類智能硬體都可與AI結合,AI處理晶片的加入將加速此類消費電子行業的發展,重點落地在手機、無人機、AR/VR、智能音響、機器人等子領域。其中,手機是目前電子行業最強粘性終端之一,也是驅動行業發展的最重要下遊產品。隨著AI晶片的加入,手機有望加速更新,繼功能手機向智慧型手機的變革之後,再次向智慧手機進化,有望迎來新一波換機潮。
(2)智慧手機=AI+AR+智慧型手機:偉大的新一輪強粘性終端革命
人工智慧元素使智慧型手機向智慧手機轉變,ASIC低成本低功耗低面積佔據核心優勢。電子行業本身利用強粘性需求所驅動,驅動發展周期約為5到7年。2002年之前由個人電腦驅動,2007年之前由功能手機驅動,2015年之前由智慧型手機驅動。但2015年以後,包括A客戶推出「玫瑰金」及「土豪金」這樣的微創新,都表現了電子行業滲透率達到一定程度之後創新開始變緩。從2015年以後,業界普遍開始尋找電子行業下一個風口,包括無人機、可穿戴AR/VR、智能音響等,但是目前此類智能硬體都不屬於強粘性終端。而只有類似手機每年出貨在15億到20億部這樣巨大量的強粘性終端才能夠支撐電子行業進一步的變革與發展。手機仍將是未來幾年不可替代的強粘性電子終端。目前AI在手機裡面主要是輔助處理圖形圖像的識別(比如拍照的快速美顏)以及語音語義的識別等應用場景。但目前此類應用對AI算法處理速度的要求並不高。隨著如AR功能的引入,並隨著光學聲學等傳感器不斷演進,對AI的計算能力需求會迅速增加,因此需要引入AI晶片來增加手機的運算能力。AI硬體晶片的引入或集成將有益於解決手機終端創新不足及目前滲透率過高的問題,未來與手機AR和3D應用的結合,會進一步推動智慧手機AI硬體的發展,從而帶動手機產業鏈的發展。同時手機對功耗要求極低,ASIC低成本低功耗低面積將佔據核心優勢。
蘋果:「Bionic神經引擎」助力蘋果迎來新一輪迎來新一輪技術革新。蘋果在當地時間9月12日發布了本年度最重量級的產品——iPhone X (iPhone 10)。iPhone X最引人關注的是其引入了Face ID解鎖功能,手機可通過對人面部識別實現瞬間解鎖。iPhone X集成了眾多傳感器,面部識別採集點達三萬個,採集完的臉部信息由神經網絡進行建模處理。為此,蘋果專門打造了專用神經網絡處理晶片A11「Bionic神經引擎」。該神經引擎使用雙核設計,每秒運算6000億次,面部信息數據都由A11引擎處理,不會送到雲端。該晶片旨在將主處理器(CPU)和圖像處理器(GPU)巨大的計算量分開,把面部識別、語音識別等AI 相關的任務卸載到AI 專用模塊(ASIC)上處理,以提升AI 算法效率,並延長電池壽命,並且最新發布的三款手機中所帶有的Siri 語音助手及增強現實(AR)功能都將利用「Bionic神經引擎」進行實時處理。A11 Bionic晶片內部的AI處理器和CPU、GPU等一起,讓新一代iPhone具備了更先進的AI能力,同時進一步降低AI處理任務對電池壽命的影響,AI元素助力蘋果迎來新一輪技術革新。
華為:引入AI晶片,差異化競爭優勢突出。2017年9月2日,在德國柏林舉行的IFA 2017 展會上,華為正式發布了全球首款移動端AI晶片麒麟970,並將運用於即將發布的華為Mate10手機中。這是業內第一次在手機晶片中出現了專門用於進行人工智慧方面計算的處理單元,它早於蘋果於9月12日發布的A11Bionic中的Neural Engine。在麒麟970晶片的設計過程中,華為與寒武紀進行了深度合作,集成了專門用於神經網絡任務處理的NPU,並且其面積僅有10×10毫米。相信隨著人工智慧的興起,手機晶片中是否集成人工智慧處理器,將會成為手機晶片,甚至是智慧型手機差異化競爭的關鍵點。
高通:即將發布AI移動晶片搶佔AI手機高地。高通一直在和Yann LeCun在Facebook Ai研究機構的團隊保持合作,共同開發用於實時推理的新型手機晶片。高通公司2017年7月宣布將發布人工智慧專用移動晶片,爭取搶佔人工智慧手機領域高地。
三星:收購AI系列公司意欲布局手機AI。2016年10月,三星公司宣布收購AI助手系統VivLabs公司,VivLabs的創始人也正是蘋果Siri的創造者,這一舉措,也證實了三星意欲布局人工智慧手機領域。
(3)智能音響:GPU目前佔據主流,ASIC方案是未來
隨著人工智慧以及物聯網的不斷發展,智能家居越來越受到人們的歡迎。目前,亞馬遜、谷歌、蘋果等科技巨頭紛紛開始布局智能家居市場。其中亞馬遜推出智能音箱Echo,在支持音箱功能的同時,更支持語音搜索、購物、提醒等多項操作。其主要晶片包括德州儀器的DSP和集成電源管理IC,三星的RAM,SanDisk的4GB快閃記憶體和高通的Wi-Fi、藍牙模塊。國內京東與國內最大語音技術公司科大訊飛聯合開發叮咚音箱,能夠在為用戶提供音箱功能的同時,支持語音控制,並致力於在未來成為智能家居的集中控制中心,音箱主晶片採用全志四核Cortex-A7 CPU,並內置Mali400 GPU,旨在發揮其計算及音頻處理功能。除此之外,國內阿里、騰訊、百度、小米都紛紛推出智能音響產品。雖然目前市面上的智能音響解決方案或者是運用GPU或者是通過雲端進行計算。但考慮到成本等因素,預計未來智能音響中ASIC將是必然方案。
(4)無人機、VR/AR:ASIC將是必然選擇
英特爾於2016年11月完成對Movidius的收購,Movidius的Myriad 2視覺處理單元擁有相當於第一代產品20倍的超強性能,它專注於圖像處理,是一種領先的視覺處理晶片。該晶片功耗很低,能夠在0.5瓦的超低功耗下提供浮點運算性能,並且使用20納米工藝製造。全球著名的無人機公司大疆在其智能無人機Phantom 4以及最新推出的Mavic產品上均採用了Movidius公司的晶片。Movidius的晶片目前廣泛用於VR/AR頭顯,室內導航,360°全景視頻等場景。因為GPU與FPGA的量產成本都相對較高,並且都具有較大的能耗,因此ASIC將成為消費電子龐大藍海的必然選擇。
3 終端AI未來:成本效能優化,作為協處理器內嵌
3.1 成本效益優化,終極形態向ASIC進化
GPU和FPGA不能滿足終端大規模、低成本應用需求。目前GPU和FPGA在終端雖然落地較快,但實現成本高、功耗大,不滿足大規模終端應用低功耗、低成本的場景要求。比如在安防領域,海康威視深眸雙目人臉智能攝像機目前方案採用GPU模塊,實現成本估算為幾百元甚至高達千元,大大增加了安防攝像頭成本,阻礙了AI攝像頭的普及速度。如果採用FPGA方案,目前單路攝像頭實現成本也需要百元以上,成本較GPU低但依舊昂貴。
從成本和效能兩個角度考慮,ASIC作為終端AI優勢明顯。同樣以安防攝像頭舉例,如果未來海思等攝像頭主控晶片供應商,未來在主晶片裡內嵌入相關AI加速硬體IP,我們預估成本增加極有可能控制在2美元以內,能極大節約智能攝像頭實現成本,加速其應用普及。
未來:進化至ASIC是趨勢,內嵌入主晶片是形態。和雲端幾種晶片長期共存不同,我們判斷,隨著AI推斷算法逐步穩定,無論安防、車載、消費電子,終端AI在終端各種場景下,都將最終進化至ASIC,以AI協處理器IP的方式,嵌入融合至現有的各種移動終端主控晶片中。對主控晶片公司而言,集成AI的IP模塊,能夠實現進化、維持長期競爭優勢。產業調研顯示,蘋果、高通、三星、華為、展訊等各大手機終端主晶片廠商都在各自開發專屬自己的人工智慧加速ASIC協處理器。此外,ARM作為老牌CPU IP提供商,也在積極開發支持AI相關運算指令集的晶片產品。9月華為發布首款內嵌人工智慧專屬處理器的手機主晶片(麒麟970),搭載在十月發布的Mate 10新機中,便是典型例證,也將成為未來終端人工智慧ASIC發展的裡程碑式事件。我們判斷,華為隨後同樣會在其安防晶片中內嵌AI相關處理器。終端AI化普及已初現端倪。
3.2 關注「中華崛起」與「帝國反擊」
「中華崛起」:中國公司在終端專用AI硬體架構領域未落人後。目前國內已有多家優秀的AI晶片創業型公司成立,主要包括寒武紀,地平線機器人,深鑑科技、比特大陸等。2017年8月寒武紀獲得國投創業領投的1億美元融資,並且華為9月發布的首款人工智慧手機處理器也搭載寒武紀NPU。深鑑科技成立於2016年,2017年公司獲得包括賽靈思在內的數千萬美元投資,目前深鑑科技推出的專業處理晶片DPU在終端相比GPU性能快80%。2016年3月奇點汽車發布會上,地平線機器人首次展示了基於雨果平臺的先進輔助駕駛系統(ADAS)原型系統,地平線計劃將其專屬ASIC處理器(BPU)集成到雨果平臺之上,預計計算性能將比目前提升2-3 個數量級,並且未來地平線還將其BPU應用於智慧家居、智慧城市等多個領域。2017年比特大陸最新發布的BM1680專用晶片是其定製化的ASIC AI晶片,適用於CNN/RNN等深度學習網絡模型的預測和訓練計算加速,32位浮點運算性能達到4TFLOPS,其競爭目標是英偉達高端GPU產品。可以看出,國產終端專用AI硬體架構目前處於世界一級梯隊,未來前景廣闊。
「帝國反擊」:英偉達開源DLA阻擊新興ASIC廠商。2017年5月GTC大會英偉達CEO黃仁勳宣布,為加速深度學習技術的普及和進步,將開源其Xavier DLA(深度學習硬體加速器)供所有開發者使用、修改,爭取佔據終端生態平臺優勢。我們認為這是重要的標誌性事件。標誌著英偉達在終端對ASIC技術路徑的認可,以及開始重視對新興廠商的阻擊。傳統GPU架構的功耗限制了其在終端市場的應用,為維持其在人工智慧硬體的霸主地位,英偉達把自己的ASIC技術路徑和相關硬體代碼開源,來應對ASIC晶片廠商的挑戰。此次開源Xavier DLA,英偉達就是瞄準嵌入式和IoT等終端市場,而這也是包括寒武紀、地平線、深鑑科技、Novomind等在內的很多AI晶片創業公司重點耕耘的領域。英偉達試圖利用硬體的開源共享和自己的良好生態優勢,在終端繼續拓展自己的帝國版圖。我們認為這勢必對新興廠商造成一定程度的衝擊,具體影響尚不明確,但云端巨頭入局終端市場已成必然,新興ASIC廠商將面臨「看誰跑得快」的競爭新局面。