2018年6月,Arm把中國業務分拆成了獨立公司「安謀(Arm)中國」,這家公司由中資51%控股,把國外的技術創新帶入中國,研發更符合中國市場需求的產品。公司成立之初,就確立了3條產品線,分別是:周易AIPU、山海平臺安全解決方案、星辰處理器。vqzEETC-電子工程專輯
2018年11月,在ASPENCORE舉辦的全球CEO峰會上,安謀中國公布全新人工智慧平臺「周易」(Zhouyi)。該平臺採用完全自主研發的AI處理器AIPU以及SDK,安謀中國還與中國生態合作夥伴共同開發了Tengine人工智慧軟體框架,適配Arm CPU、Mali GPU和第三方AI處理單元,實現人工智慧算力優化。vqzEETC-電子工程專輯
2020年8月6日,在ASPENCORE集團舉辦的第二屆國際電子產業鏈資源對接大會上,安謀中國資深AI產品經理楊磊(Alvin Yang)發表《周易AIPU賦能AI多樣創新》的演講,詳細介紹了周易AIPU的性能參數,支持的產品類型以及適合的應用場景,並談了安謀中國在人工智慧方面的產品和布局。vqzEETC-電子工程專輯vqzEETC-電子工程專輯
安謀中國資深AI產品經理楊磊(Alvin Yang)vqzEETC-電子工程專輯
傳統上大家對Arm的認識,主要是應用在端側或者物聯網設備、手持設備上。雖然一般的終端用戶很難接觸到Arm公司,但基本上每個人用的設備中都會有Arm,比如95%的手機都會用Arm架構的主處理器或GPU,另外智能電視、機頂盒等設備,底層也大多採用Arm解決方案。vqzEETC-電子工程專輯
Arm第一個權重產品是處理器解決方案,除了我們熟悉的應用處理器系列,還面向人工智慧在處理器的架構上不斷演進和升級。楊磊預計,在未來3-5年內可以通過CPU通用算力平臺,在人工智慧方向上提升10倍的計算能力。vqzEETC-電子工程專輯
Arm第二個被廣泛採用的是GPU產品,據楊磊介紹,Arm GPU的出貨量已經達到一年10億顆。GPU的本職工作雖然是做3D渲染或實現手機遊戲的一些功能,但由於它本身計算能力強大,很多應用也會用GPU通用計算能力做深度學習功能。所以Arm在GPU架構上也不斷演進,以增強對人工智慧場景的運算能力,「我們的GPU架構,從最早只能支持fp32計算,到現在的新架構可以原生支持fp16的計算,從而使GPU在深度學習領域中也能有成倍甚至接近於10倍的性能提升。」楊磊說到。vqzEETC-電子工程專輯
據楊磊介紹,截止2018年,基於Arm的晶片解決方案累計已經出貨1000億顆,預計會在未來10-20年達到1萬億顆。vqzEETC-電子工程專輯
「這是一個十分巨大的量,端側晶片會產生大量的數據,可以透過5G通信或者IoT把大量數據回傳到雲端,雲端基於豐富的數據,基於現在的大數據、人工智慧技術,會產生更加人性化、為大家服務更好的算法或人工智慧應用,又重新下載到本地端,更好的服務於我們的生活。」楊磊說到。vqzEETC-電子工程專輯
由此可見,AIoT未來是一個非常廣闊的市場,而且這個市場是正向循環、不斷相互促進的。既然看到這個大的市場,那大家都會想要做點什麼,這也是Arm在中國成立人工智慧產品線,推出深度學習解決方案「周易」的初衷——不僅專注在手機、IoT關鍵設備等領域,還要在雲端、車載等等其他領域有所布局。vqzEETC-電子工程專輯
周易的定位不像通用處理器或GPU,其IP是專門面向深度學習設計的一套架構和解決方案,同樣也是一個IP盒。比如在SoC維度上,周易可用一個完整的異構平臺覆蓋全部硬體場景,包括已有的CPU、GPU。vqzEETC-電子工程專輯
楊磊表示,周易AIPU是安謀中國自主研發,是一套國內從頭到尾完全自己設計的解決方案。「它跟Arm CPU架構是兩套獨立的架構,沒有任何聯繫」,其系統底層是面向深度學習重新定義的指令集,在這個指令集基礎上又實現了符合這個指令集的周易人工智慧處理單元,也就是周易AIPU,它具有高性能、低功耗和安全的特性。vqzEETC-電子工程專輯
現在人工智慧的應用十分豐富,有各種各樣的場景,有視覺為主的,也有語音為主的,視覺又有檢測、分類等各種算法在裡面,不同的解決方案用的算法也不太一樣。楊磊發現,有些算法能力強的合作夥伴會做自定義算子,比較私有化,所以安謀中國在設計周易解決方案時,就考慮到了靈活性和通用性。vqzEETC-電子工程專輯
vqzEETC-電子工程專輯
「我們的架構中分為兩類最重要的功能,一部分叫通用算力,靈活可編程,可以支持各種比較冷門的算子以及用戶的自定義算子;另外一部分跟AI公司講的自研AI解決方案一樣,我們把它叫做專用算力,它更多採用的是一種加速方式支持大算力、高密度以及高能效的特性。」楊磊解釋道,「周易的架構是把這兩部分有機融合在一起,構成了人工智慧的解決方案。」vqzEETC-電子工程專輯
周易解決方案適合用於語音場景、視覺場景。視覺場景方面,可在安防、智能家居領域做人臉/圖像分析、檢測,還能用於手機上的摳圖、美顏、背景虛化等。vqzEETC-電子工程專輯
至於語音場景,現在大部分都是本地採集聲學信號,自然語言處理(Natural Language Processing ,NLP)或者自然語言理解(Natural Language Understanding,NLU)功能只能通過網絡傳到雲端解析計算,這主要是受限於傳統AIoT設備的算力不夠。但因為語音交互時,往往需要能夠快速響應,還會涉及到一些隱私問題。在有一些場景信號不好,或是沒有網絡的場景下,只有本地識別才能有好的用戶體驗。vqzEETC-電子工程專輯
楊磊表示,周易的計算能力完全可以勝任本地做自動語音識別(Automatic Speech Recognition,ASR)或者自然語言理解,這樣能解決一些實時性和隱私性問題,而低功耗特性也可以滿足關鍵詞檢出(Keyword Spotting ,KWS)功能的要求。vqzEETC-電子工程專輯
目前學術界對語音的識別、深度學習方面的應用,有很多新嘗試。比如用神經網絡的方式實現端到端(End to End)的語音識別,而且不僅是實現識別功能,還把語音的去噪、增強等都實現了,從而達到更高的識別精度。vqzEETC-電子工程專輯
「用周易方案可以很好的實現這些功能,並且是在本地實現。」楊磊說到。vqzEETC-電子工程專輯
vqzEETC-電子工程專輯
周易專為智能家居打造的Z1-0701與通用DSP在支持AI性能和能效上的對比vqzEETC-電子工程專輯
這得益於周易本身可靈活可配置的計算能力,從0.1TOPS一直支持到256TOPS。「不過本地語音場景不需要這麼高算力,只需要選一個性價比最高的就好。」楊磊建議到,「我們一般建議合作夥伴用最小配置,0.1-0.2TOPS算力水平就可以很好的在本地做語音功能。」vqzEETC-電子工程專輯
另外周易屬於面向深度學習的專用處理器,原生支持常見神經網絡的軟體框架,也便於用戶或者開發者在上面做算法的移植和部署,和通用架構相比,在面積、成本、功耗上都有優勢。vqzEETC-電子工程專輯
vqzEETC-電子工程專輯
2020年4月,全志科技發布了基於周易AIPU的產品智能語音專用處理器R329,這也是安謀中國耗時兩年研發周易AIPU的落地首秀。vqzEETC-電子工程專輯
據楊磊介紹,全志該產品線系列已經在市面上的智能音箱中大量使用,其他一些合作夥伴的產品也馬上會面世。未來安謀中國希望籍由周易人工智慧平臺,賦能各個行業底層應用解決方案。vqzEETC-電子工程專輯
責編:Luffy LiuvqzEETC-電子工程專輯