2月5日—7日,鳳凰網財經峰會在北京舉行,本次峰會以「破局與新生」為主題,梁振英、尚福林、殷勇、李揚、宋志平等多位政商學界嘉賓出席。
在「2020鳳凰網財經峰會」線上論壇上,香港科技大學工學院院長鄭光廷表示,硬體與晶片平臺在人工智慧革命中扮演著非常關鍵的角色。在某些領域,機器學習跟人工智慧演算法能達到的精度,超過了應用所需的精度。比如人臉辨識。這些精度的進展主要依靠的是大數據,但大數據的計算需要大量的計算資源及能耗,只有這些精度更上一層樓,才能開創更多其他新的應用。
鄭光廷指出,人工智慧和機器學習硬體也不可避免地面臨挑戰。做人工智慧機器學習的算法,訓練一個模型需要幾個禮拜,甚至更長時間,這意味著市場流失,能效低。市場迫切需要加速人工智慧計算,而解決這些問題的關鍵是設計下一代的人工智慧晶片。這種情況下市場就對設計晶片團隊提出了更高的要求,新一代人工智慧晶片在更高效的同時,要兼顧晶片的效用,增廣晶片的用途,以提高市場利用率。
鄭光廷還表示,下一代人工智慧晶片與硬體要能做大規模、高效率的數據處理。過去所有的計算處理器,都是以計算為中心,也就是要不斷做計算,用少量數據支持計算。到了人工智慧時代,數據成為主體,以內存為中心的體系結構是未來晶片的新體系結構,過去的結構是用數據去服務計算,未來將變成以計算服務數據。
以下為鄭光廷演講實錄:
鄭光廷:非常感謝鳳凰網的邀請,很高興出席2020鳳凰網財經峰會,我想今天跟大家聊一聊《人工智慧晶片未來:企業的芯》。
一、微電子與集成電路
在談人工智慧晶片之前,我想看一下微電子與集成電路這個大方向。
集成電路與微電子是推動全球創新,具有戰略地位的一個技術領域。
首先,它是一個非常基礎的領域,這代表做芯的長遠科研是非常重要。
其次,它的應用非常地廣泛,從機器人到消費電子、到人工智慧、到汽車、到航空航天、生物醫學等等。
如果在這方面能做出好的晶片以及微電子的技術,對於人類跟國家策略影響非常長久和遠大。最後,它是一個人才密集的行業。這代表高等教育必須扮演很重要的角色,同時它的門檻非常地高,代表做短線是不行的,必須做長期的科研投入,那麼長期經驗及技術累積是必需的。
這個過去大概有五年的時間,美國在這方面還是領先的,韓國、日本、中國大陸跟中國臺灣都扮演一定的角色。
中國通過過去十年的投入漸漸開始有一些成績,但還有一條很長的路要走,中國必須要在這方面投入。不過這個領域很大,而今天我想談的主要是人工智慧硬體。
大家已經看到這些年人工智慧的應用,從交通到智慧城市、到金融科技、到醫療保健,到教育,人工智慧的應用無所不在。這些應用都是在這個所謂人工智慧基礎設施上面,包括人工視覺、機器學習、自然語言處理,這些基礎設施上面來做應用。而這些基礎設施的演算法又是在晶片與硬體平臺上面跑。
二、智能硬體
硬體與晶片平臺扮演著什麼樣的角色?
事實上,這些硬體平臺在過去五到十年的人工智慧革命中,扮演著非常關鍵的角色。
在某些領域,機器學習、人工智慧演算法能達到的精度,超過它應用所需要的精度。比如人臉辨識、目標測試、自然語言測試等。但這些精度的進展主要依靠的是大數據,而大數據的計算需要大量的計算資源及能耗。所以,這樣的精度進展並不是免費的。不過,這些精度還需要更上一層樓,才能開創更多其他新的應用。
繼續靠目前的演算法就會需要大量的計算資源,而硬體資源是沒有辦法支撐人工智慧需要精度的承載,所以必要的方向是設計新的硬體、新的晶片,能更配合智能計算的特性。簡單講,就是要改變這條曲線的斜率,能夠用比較少量計算資源增加達到更高度的精度增加,這條路所需要的就是設計新人工智慧晶片。
目前,人工智慧計算的晶片,大部分是仰賴圖上這兩類的處理器。比如,中央處理器跟圖形處理器。
這些處理器都是通用硬體,也就是寫好軟體的人就在這個通用硬體上面來跑,它們的靈活度很高,但問題是這些通用的處理器,設計硬體的時候不是專門用於人工智慧的應用。如果增加它的效能,我們就應該設計像右邊這樣的專用集成電路、專用更高效的集成電路來配合人工智慧的演算法。
在過去五年左右,很多系統公司、應用公司都在走這條路;而從十年前開始,蘋果就自己在設計自己的處理器。當然,我們香港科技大學出來的大疆等,也在設計它們的人工視覺晶片。比如,自駕車特斯拉,他們在設計自駕車專用的晶片。在每一個人工智慧領域,系統公司都希望設計他們自己的專用晶片來加速其人工智慧計算的速度及效能。事實上,不僅是大公司能夠做,小公司甚至應用公司、系統公司都希望介入這塊領域做專用晶片的設計。
三、人工智慧的價值鏈
人工智慧整個的價值鏈,從應用到軟體到硬體。
在應用方面,有各式各樣的解決方案,比如在Fintech、教育、健康等方面所需要的解決方案並不一樣,而從市場角度而言是非常碎片,需要行業的定製化。
但這些領域需要的人工智慧的支撐,所需要的演算法多半來自幾家大的公司,比如谷歌、微軟、百度,他們會提供算法的平臺。
在過去,這些算法就直接架在通用硬體上,比如中央處理器、圖形處理器、CPU、GPU上面。這些也是大廠提供的一些平臺,比如intel的NVIDIA、AMD的CPU、GPU,當然這些晶片都是在標準的製成技術上面,像臺積電、像三星的製作。那我們剛剛談到要加速人工智慧計算這一塊,產生了中間這一塊專用晶片及加速器的市場,這塊市場它事實上是非常新興的,我們看到過去這五年左右,有非常多的新興公司,包括大型的國際企業也都加入這一塊,在設計下一代的專用人工智慧晶片,這個機會無限。
四、人工智慧/機器學習硬體面臨的主要挑戰
第一、做人工智慧機器學習的算法,首先是速度太慢。通常訓練一個模型需要幾個禮拜,甚至幾個月的時間。設計這樣的晶片周期很長,同時也需要一個很大的團隊,常常需要幾百個人,甚至幾千個人,而這常常意味著市場流失,能效低。
第二、在技術上面,真正的問題是存儲牆的問題。在做計算時,計算器跟內存,跟儲存、存DATA這兩邊要溝通,它們的溝通之間的速度沒有辦法趕上計算的東西所需要的速度,所以這個存儲牆面臨的挑戰越來越大,這是必須解決的。
第三、做出來的模型就是機器學習出來的模型,數據量越來越大,難以存儲分發。因此,解決這些問題的關鍵是設計下一代的人工智慧晶片。簡單而言,就是要做得更快速,更節能。設計晶片能用小型的設計團隊在幾個月內完成,同時設計出來的晶片的用途也不要只是為測定用途,能夠增廣晶片用途來增加市場。
五、下一代的人工智慧所需要的技術
簡單而言,人工智慧晶片與硬體所要做的是能做大規模、高效率的數據處理。人工智慧計算演算法的特性是,數據量越來越大,計算量是爆炸性的,但數據量的計算卻呈現局部性下降趨勢。因為數據量增加,每一個數據都要做計算,所以計算量有爆炸性。然而對於每一筆數據所做的計算,強度事實上是下降的。
比如,我們需要做一個像螞蟻雄兵一樣的晶片,有很多很小的計算體來處理大量計算,每一個計算體去處理一些數據,但它們可以處理的數量總和是巨大的。但每一筆數據所需要的計算強度是很小的。所以不需要去設計一臺獅子,雖然能力很強,但是叫獅子去做螞蟻就能做的事,就是殺雞用牛刀。
過去所有的計算處理器,都是以計算為中心,也就是要不斷做計算,然後用少量數據支持計算。到了人工智慧時代,數據成為主體,以內存為中心的體系結構,才能處理大數據。以內存為中心的體系結構是未來晶片的新體系結構,也就是說,以數據去服務計算的結構,變成以計算去服務數據的結構。
另外一個非常重要的方向是,非易失性存儲器會起更重要的作用。
在未來的人工智慧晶片裡,有很多的應用計算可以隨時進行,有時候沒有電要停下來,但又不希望把過去已經做完的計算完全丟失掉。當沒有電或要暫時停止計算時,這個存儲器能把目前的狀況完全存下來,即使沒有電資料也不會流失。很多新興存儲器技術,就是非易失性存儲器,它在未來人工智慧技術上扮演很重要的角色。
另外一個必須要提的是,在設計下一代的人工智慧晶片硬體時,不只是做電路設計,也不是做最新晉的器件。它必須要把算法、器件、電路設計、晶片架構及系統架構整個整合起來做整體的考量,以及做協調一致的努力,比如功能。
如果設計的晶片要放在伺服器、放在數據中心的計算系統裡,它需要非常高效能,這個高效能就是考量。但是如果你的晶片是要放在移動端,放在傳感器,放在物聯網裡面,那它高效能是主要的考量,這兩類的晶片不可能用同樣架構,也不可能用同樣器件。
第三類的功能,比如做Deep Learning、Neural network,神經形態計算系統。這時規模的擴展性成為最主要的考量,架構的考量遠遠超過電路設計跟器件的功能。比如,需要客制化。
但客制化前先要想使用的場景與使用的特性,然後才能進一步決定體系結構層次的考量。另外,在器件上的考量也是根據需求功能。根據需求架構來做配合,在這方面我剛才也有提到,如何探索新興非易失性存儲器的適用性跟具有高效的利用性有非常多的新興的存儲技術來做配合。
最後,我強調重點在於,設計下一代人工智慧晶片內存儲存器、計算處理器。
還有在它們彼此之間的互聯,必須做到無縫的異構集成,那這種集成本身就是一個最高指導原則跟技術。那了解決這些問題,絕對不是單一領域的人或是專注做電路設計的人能夠完全開發出來。
因這樣的需要,香港成立了香港智能晶片與系統研發中心。而這是由香港科技大學、美國史丹福大學、美國伊利諾州香檳大學、香港中文大學以及香港大學五所大學共同創立的一個智能晶片研發中心。
我們的展望是希望能夠支撐無所不在的人工智慧。將來人們穿的衣服、戴的戒指、戴的珠寶、戴的手錶、跑步的鞋子等,所有的物聯網器材裡面都可以存在人工智慧的功能。
達到這個願景的晶片與硬體,第一,它要非常地小,第二,它的性能與效能要提升比現在最少是三個數量級以上。
另外一方面,因為它的應用這麼廣,它客制化要求這麼高,我們必須要能夠加快設計這類人工智慧晶片的效率,縮短從設計到量產的時間,不然無法趕上市場的需求,那設計成本也會過高。
達到這樣的展望,人工智慧設計中心大概有四大策略:
第一個,將一些新興的技術跟目前主流矽晶片做無縫集成。
這些新興的技術包括,要探索新興存儲器的技術、矽光子技術,就是Silicon photonics技術,還有3D的Stacking技術,3D堆疊技術。這些技術結合目前矽、晶片的技術,讓它們做異類集成,這是未來人工智慧必須走的一個方向。
第二個,以內存為中心的晶片結構。
第三個,人工智慧設計自動化的工具與設計方法。
因為你一定要加快這個設計的時程,一定要有新的工具,也一定要有新的設計方法,來減少設計的人力跟設計的時間。
最後一點,我要提的就是算法與硬體的協同設計跟協同優化。
目前,在做人工智慧跟機器學習算法時,我們是把它寫成軟體,然後在通用硬體上面,比如中央處理器、圖形處理器這些通用硬體平臺上來跑。這個就可以看出來說,兩個顏色,上面軟體是灰的,下面硬體是紅色的。我們現在所做的這個人工智慧晶片都是定製硬體加速器,讓硬體來配合演算法跟人工智慧計算的特性,這樣能提供10到100倍可能優化的空間。
接下來,因為硬體也有瓶頸,我們可以改變軟體的算法,因為同一項工作可以用不同的算法去做,然後我們來看看硬體上面的瓶頸,進而來調整軟體。這樣從硬體上面去定製軟體,軟體再來配合硬體的調整,又可以增加一到兩個數量級可能的優化。
經過這樣反覆的優化,我們就可以做出特製化的晶片,比如專門為計算機視覺做出來的晶片,在這個圖上看到的每個橢圓形畫出來的就是一個結合演算法跟硬體的一個加速器。在機器學習上面也可以有一個特定的加速器,在自然語言處理上面有個加速器,這樣可以提供我們兩到四個數量級可能的優化空間,這就是我們做下一代人工智慧的一個策略。
根據這樣的一個想法,我們定出來的目標、科研計劃及設計的動因,組成了一個具有高度互補性而世界一流的專家團隊,總共帶有超過25個教授跟世界級的專家。他們是不同領域的專家,有些人是專門做電路設計的,有些人是器件上面的專家,有些人是算法上面的專家,有些人是計算機體系結構的專家。我們會組織一個超過100個人的團隊,招收資深的研究人員、博士後、不同的工程師,希望能夠在這個領域做更大的貢獻。希望在人工智慧晶片與硬體的設計上面,能有新的創新,做出更快速、更節能、更具拓展性,進而讓小型的設計團隊在很短時間內就能高效完成的設計。
(文章來源:中華網財經)