芯潮(ID:aichip001)文 | 心緣
在人工智慧(AI)晶片的熱潮中,有的人看見了落地機會,有的人卻將目光投向遙遠星空。
北京,這個國內AI晶片的沃土中,新的勢力正在孕育。來自清華、北大、中科院的十五位科學家集結在一起,圍繞智能晶片的核心技術展開基礎研究。
借2019北京智源大會舉辦之際,智東西同少數媒體採訪中科院計算所研究員、智源首席科學家陳雲霽,試圖從和他的交流中,了解AI晶片被看好的研究方向以及當下面臨的挑戰。
▲中科院計算所研究員、智源首席科學家陳雲霽
一、凝結AI晶片人才的智源學者計劃
在切入正題前,我們先來簡單聊聊將十五位科學家凝聚在一起的背景。
為將北京打造成連結世界人工智慧產業與學術資源的中心樞紐,2018年11月,北京智源人工智慧研究院(以下簡稱「智源研究院」)成立,擬採用新的科研組織形式和人才培養模式,建成全球最優的人工智慧學術和創新生態,推動北京成為全球人工智慧學術思想、基礎理論、頂尖人才、企業創新與發展政策的源頭。
智源學者計劃,正是實現這一目標的主力軍。
這一計劃將技術路線決策權和人財物支配權全部交於科學家,試點科技經費「包幹制」,使科學家可以心無旁騖、潛心研究、創新突破。
依託北大、清華、中科院等優勢高校院所,以及北京市人工智慧骨幹企業研究院,智源學者計劃重點支持智源科學家首席(CS)、智源研究項目經理(PM)、智源研究員(PI)、智源青年科學家四類人才,擬三年內遴選超過300名智源學者,並在全球範圍內緊密聯繫超過3000名人工智慧領域頂尖學者。
就在1個月前,智源研究院公布「智能體系架構與晶片」方向及候選名單。
這是繼「人工智慧數理基礎」、「機器學習」、「智能信息檢索與挖掘」後,智源研究院公布的第四個重大研究方向,由中科院計算所研究員陳雲霽任首席科學家,中科院計算所副研究員郭崎任研究項目經理。
入選候選名單的9位智源研究員(PI)與6位智源青年科學家來自北大、清華和中科院,均是這一領域具有國際影響力的中青年學術帶頭人。
通過將晶片設計方法、多種智能晶片、編程編譯、智能終端雲端系統等不同領域的學者連接在一起,智源研究院想以先形成內部生態的方式,之後逐步拓展,為之一研究方向創造更多的機遇與價值。
二、智能體系架構與晶片研究的四個層次
其他重大研究方向更偏向算法與應用,「智能體系架構與晶片」方向更多偏向硬體與系統。某種意義上來說,這一方向在整個智源研究體系裡是最底層、最基礎的。
這一方向有四個層面的研究:整機、編程、晶片、方法。
(1)整機,相當於交付一個完整的智能計算機。
(2)程式語言和編譯,主要研究如何寫智能程序、用什麼語言、寫出來的智能程序怎麼編譯到晶片。
(3)晶片,即做各種各樣具體的智能晶片。
(4)方法,主要研究開源智能晶片的設計方法學,即怎麼能夠快速用開源工具設計出新的智能晶片。
關於研究方向的選擇,陳雲霽告訴我們,設置方向之處,源碼資本投資合伙人、智源研究院首屆理事長張宏江博士,北京大學教授、智源研究院院長黃鐵軍老師,均向陳雲霽他們提供了一些建議。
他們認為,現在企業能往產品做的事情,已經有很多投入、很多人在做,智源不要做這些,而要看向更遠的東西。
三、面向未來的四類AI晶片布局
據陳雲霽介紹,在晶片方面,「智能體系架構與晶片」方向目前主要有四類布局。
這四個領域都具備學術前瞻性,或屬於國際學術的前沿領域,或是未來很有潛力的學科增長點,或有非常實際的應用需求。
1、類腦智能晶片
類腦智能晶片的設計思路是,希望晶片能夠像接近我們大腦工作機理去運轉。
前段時間,清華大學施路平老師帶隊研發的類腦晶片,登上《Nature》封面,並創下中國人工智慧和晶片論文在《Nature》上零的突破。
這說明在這個方向,北京在國際上都是處於比較前列的地位。
2、機器學習處理器
智源研究院未來想做的機器學習處理器,不僅僅是深度學習,還能夠高效處理貝葉斯、決策樹、信息回歸等更廣闊的機器學習方法,我們都能夠非常高效地去處理。
3、可重構智能晶片
未來十年、二十年,智能算法還會快速發展,以後產生出來的智能算法可能是我們今天聞所未聞,甚至是想都沒有想到過的。
如果未來的智能晶片不能支撐未來新的算法,業務面就會受限。因此智能研究院希望探索一種可重構的智能晶片的方法,可根據應用需求,去靈活進行動態配置,適配未來的算法。這樣未來不管智能算法怎麼演進,晶片都能較好地支撐。
4、應用驅動的晶片
在日常生活中,人們得到的信息都是時序信息。通常人們在外界收到的都是視頻序列和語音的序列,面向視頻的序列和語音序列的應用也非常多。
目前中科院半導體所在研發一類以應用為驅動的專門的晶片去處理時間序列的信息。
四、9位研究員和6位青年教師的研究方向
目前,「智能體系架構與晶片」方向共有9位智源研究員和5位青年教師。
研究整機的有清華大學教授陳文光和中科院計算所研究員韓銀河。陳文光主要做智能雲端計算系統,研究高性能稀疏張量編譯器;韓銀河主要做智能終端系統,研究方向是算控一體的機器人智能晶片。
研究編程和編譯系統的有清華大學研究員張悠慧,他的研究方向是面向神經形態晶片的類腦神經網絡建模與編譯技術研究,清華類腦計算晶片天機芯中的編程和編譯系統即是由他來完成的。
類腦晶片方面,有北京大學教授蔡一茂、中科院微電子所研究員劉琦。蔡一茂擬從事類腦神經形態智能晶片設計關鍵技術研究,劉琦的重點研究方向是基於憶阻器的類腦計算晶片研究。
機器學習處理器方面,任首席科學家的中科院計算所研究員陳雲霽擬研究的是機器學習晶片統一分形體系結構,清華大學長聘教授尹首一研究可重構數模混合智能計算晶片。
在面向時間序列信號的類腦神經網絡晶片方面,主要研究者是中科院半導體所研究員魯華祥,他在神經網絡硬體領域有很長時間的積累和傳承,魯華祥的老師正是我國著名半導體電子學家上世紀90年代就在做神經網絡計算機工作的王守覺院士。
做開源晶片設計方法的有兩位研究員,一位是北京長聘副教授羅國傑,研究開源智能晶片敏捷設計方法與工具,另一位是中科院計算所研究員包雲崗,研究基於人工智慧的開源晶片敏捷開發平臺,他們均在國際上有一定影響力。
6位青年科學家中,清華大學副教授翟季冬在做面向人工智慧晶片的編譯器。
清華大學副教授李國齊研究異構融合類腦計算框架,他也是類腦晶片天機芯的主要參與者之一。北京大學研究員楊玉超也在做類腦晶片,他研究的方向是面向類腦智能的神經形態器件與系統。
中科院計算所副研究員陳曉明主要研究存算一體架構、EDA與模擬器。中科院計算所副研究員杜子東在做大規模異構智能計算系統架構研究,北京大學副教授孫光宇則聚焦於邊緣計算場景低功耗加速器設計。
五、哪類晶片的發展潛力更大
陳雲霽認為,「智能體系架構與晶片」方向著重研究的四類晶片都很有發展潛力,如果未來智源不斷發展,完全可能再支出第五類、第六類晶片。
在他看來,基礎研究的模式可能跟純做大工程不太一樣。
大工程如果說做一個原子彈,最後就是一個原子彈;而基礎研究要同時平行探索好幾條路徑,到底哪條路徑能成功,需要時間來檢驗。
這個過程中,路徑可能有分叉,也可能有合併。現在是四條路徑,有些青年科學家產生一些新的想法,可能有第五條、第六條,也有可能會合併,四條變成三條。
如果將目光放置三十年、四十年甚至更久,陳雲霽認為類腦晶片將有很大的潛力,今天它還發展的並不成熟,但陳雲霽相信,這是他們做科學研究的終極目標。
而如果從比較實際的角度來看,機器學習技術正被廣泛使用,機器學習處理器是短期從基礎研究變現應用的一個較快的手段。可重構晶片、時間序列的晶片同樣也非常有價值。
至於陳雲霽正研究的分型體系結構,與上述四個晶片方向是正交關係,對這個四個方向都能發揮價值。
分型要解決的問題是希望能有一種體系結構模式,既能夠支持非常大的晶片和非常大的機器,也能夠支持非常小的晶片和非常小的機器。這種體系結構的模式,在某種意義上,對現在這四類晶片都有裨益。
以類腦晶片為例,有時需要設計神經元數量等同於人腦的類腦晶片,有時則需設計只有幾百個到幾千個類腦晶片。為每個晶片都專門設計一個結構是不現實的,可能要靠分型的方法來解決這個問題。
陳雲霽表示,現在判斷這些晶片的未來發展情況還為時尚早,需要十年、二十年才能檢驗出來。
至於未來晶片設計上的變化,他認為,定義一個特定領域,然後較自動化地用一些EDA工具快速生成,這是十年內完全有可能實現的。而從更長遠來看,或許有一天智能算法發展到非常好的程度,計算機完全從頭到尾設計出一個晶片來,不需要人幹預,這就可能是三五十年的目標,是非常有意思的嘗試。
六、知識分層問題怎麼解?人才培養是不是燒錢?
當下軟硬體的知識分層很嚴重,做系統軟體的不懂微電子,做底層硬體的又對上層應用於系統軟體知之甚微,怎樣才能對其他層有更多的了解呢?
陳雲霽引用計算機領域的一句話:「沒有什麼是抽象解決不了的,如果抽象不夠,就再加一個抽象層。」
他提到這種現象在高校中也非常嚴重,比如傳統體系結構課中,面試本科生時,不管清華、北大還是中科大的學生,問體系結構的知識很清楚,問作業系統也很清楚,但是結合的時候基本說不明白。
為什麼說不明白?這肯定不是清華、北大、中科大的學生不聰明,而是老師教的不對。
想到這一點,後來,陳雲霽就開了一門叫智能計算系統的課,希望能將這些知識體系串聯起來。比如以智能計算某一個特定任務為入手點,從上層的算法、系統軟體、編程框架,到作業系統、晶片,把技術棧串起來。
這門課在全球十所高校均有開設,但還是不太容易,在不同學校上這門課的感覺不同。
在北大上課的效果較好,這些學生基礎相對更好,能夠比較快地理解如何將知識點串起來,而在有的學校,學生還沒有完全理解單個的知識點,想解決綜合問題就更加困難了。
中科院計算所研究員包雲崗對這一觀點進行了補充,除了建議更多學校將這種串聯多個層次的課開設起來,他也提到,能跨通多個層次的人才畢竟還在少數,將所有人都培養成這樣也不現實,關鍵是找到有這個能力的學生後好好培養,也許他們出來以後,能在頂層架構設計上有更多的貢獻。
由於晶片流片封裝都需要大量開銷,但學生們設計出的晶片往往並沒有得到應用,那麼做流片、封裝這些後續的流程是不是白白浪費錢?
包雲崗認為,我們需要能有一種機制,幫熱愛研究的學生找到成就感,模擬和最後真正流片出來是有差別的,他們希望通過這個方式起到兩個作用,一是幫學生走完流程,二是把開源EDA完善。如果讓企業去用,可能企業用一次後就不願意用了,而通過與學生的緊密互動,其中有更多機會可以迭代。
陳雲霽同樣並不認為這是浪費錢的事情。
從國家角度來看,我國晶片設計人才仍很匱乏,人才基數少,研發實力遜於美國,怎樣低成本又快速培養出大量晶片設計人才呢?
陳雲霽的博士生導師曾告訴他,一個小的晶片設計師就是拿錢砸出來、拿失敗耗出來的。
他提到,培養一個頂級晶片設計者所耗的錢是以億計的,如果用同樣多的錢,每花五萬元培養一個人,雖然不是最頂級的,但這個人可以
從邏輯設計到封裝再到後面電路板上調試問題全部搞定,這樣就能為國家培養兩千個還不錯的人才。這對國家而言不是浪費錢的事情,而是造福國家、企業的事情。
結語:科研需要想像力
在產業界,我們可能更去關注一顆晶片能做什麼,比如它是能加速視頻圖像處理還是語音處理。但對於像陳雲霽這樣從事基礎研究的科學家們而言,他們更多從底層的角度來往上看,去做更具前瞻性的基礎研究。
這些中青年科學家所聚焦的領域,無論是機器學習處理器、應用驅動的專用晶片,還是可重構智能晶片與類腦智能晶片,儘管代表了AI晶片的不同研究方向,但它們都正走向一個共同的目標,在能效越來越高的同時,讓晶片的應用更有通用性。
我們不乏能將產業落地、工程問題解決很好的人才,但很多時候,科研不是缺乏能力、技術與手段,而是缺乏想像力。而在歷史的長河中推動科技變革的,往往是那些敢於想像、準確判斷方向並付諸長期研究的科學家們。