洪泰出品:
最近晶片這一我們知之甚少,但其實平常生活中經常會用到的「小」東西火了一把。
沒錯,晶片實體就是一個小到需要顯微鏡去觀察的東西。一個集成數十億晶體的晶片其實比我們拆開手機後蓋、經過封裝後的晶片還要小得多。然而,就是這麼一個小東西,卻承載了整個信息社會所有的算力。
那麼未來中國在晶片領域有機會超越美國嗎?超越的突破口可能會出現在哪一技術領域?
本文特邀行業專家、洪泰Family代表——深圳九天睿芯創始人劉洪傑及其團隊從行業角度,深度解析中國晶片發展的前景問題。關於晶片的產業鏈、晶片行業的壟斷、中國晶片的機會等大家關心的問題,都將在本文一一呈現。
人們經常把晶片比喻成大腦,這是正確但不完整的。整個信息化社會其實都基於兩大基石,一個是計算,另一個是通訊。因此,晶片還有一個很大的功能是用在通訊上面。如果說計算晶片相當於人類的思考能力,那麼通訊晶片就相當於人類的交流能力。
現在通訊領域所有核心晶片基本都掌握在美國兩個晶片巨頭的手中,分別是高通和博通。除此之外,一些高性能的數模轉換晶片ADC,也是被美國廠商(ADI)所壟斷。
很多人都會有這樣的疑問,為什麼中國在很多行業取得巨大進步的今天,晶片作為國家重點發展的行業,卻難以得到發展?原因有很多,包括經濟、教育、國外技術封鎖等等。作為晶片設計的工程師,我們將從技術方面說一下自己的看法。
一、晶片產業鏈巨大
晶片產業最上遊是EDA軟體,然後到晶片設計、晶片製造,最後是封裝測試。這四個流程中,是一環扣一環,任何一個地方出問題,最後生產出來的晶片就是廢品。
這四個環節當中,每一個環節又需要很多產業鏈支持。如晶片製造需要的光刻機,全世界只有荷蘭AMSL能夠製造高端的光刻機。整個晶片產業鏈的廣度和深度都註定這是一個需要國際分工的產業。它所需要的尖端設備、儀器很多,所以基本上不可能由一個公司,甚至一個國家能夠獨立完成。我國晶片產業由於起步晚,尖端製造設備非常依賴於歐美、日本等國家。這也造成我國晶片行業發展之艱巨。
二、晶片設計中的三大壟斷
作為晶片設計工程師中的一員,深感晶片產品的應用遠遠不是一個簡單的技術問題。正如前文所提到的,晶片行業的兩大基石是計算與通訊。
生態系統壟斷
先說計算晶片吧,最常見的是計算機裡用到的CPU。當英特爾與微軟組成Wintel聯盟之後,計算機晶片基本成為英特爾搖錢樹。其實比起CPU設計技術的本身,CPU的商業化更重要的是生態系統。一款不能兼容Windows系統的CPU,再高的技術與性能也是無濟於事。
專利壟斷
在通訊晶片領域,雖然不存在生態壟斷,卻到處都是專利壟斷。晶片只是實現通訊的一個載體,在這個載體之上是各種通訊協議,意味各種專利。因此,我們可以預見在5G時代,通訊晶片的玩家肯定只有幾家行業巨頭,包括高通、華為、三星等。
技術壟斷
最後一種是技術壟斷,就是各種模擬晶片行業巨頭,包括德州儀器,ADI等。它們以自己獨特高超的模擬晶片設計技術,賺著超高的利潤,毛利率超70%,淨利率達40%。高利潤也意味著高門檻,要不然國內早就有一堆企業進場,把價格拉低。
優秀的模擬設計人才是模擬晶片從業公司與數字晶片從業公司之間天然的壁壘和護城河。數字(前端)工程師通常工作在架構/系統級別,對於晶片的性能有整體的認識和把握。數字晶片對工程師的要求偏廣度。模擬工程師通常工作在電路級別,需要關心電路細微的細節和具體物理的實現,對具體問題有豐富的數學模型構建能力和推導能力。
世界前10大模擬晶片企業
很多時候,模擬工程師需要能夠在保留所關心問題本質的前提下簡化和近似模型。有人將這種能力表達為一種「藝術」或「直覺」。實際上,這種直覺是極大程度上建立在嚴謹的數學基礎上,是長期大量經驗積累的結果。這就造成了模擬電路工程師成長周期緩慢。
有人曾說,10年以內經驗的模擬工程師並不能稱為優秀的模擬電路工程師。很多原本的模擬電路工程師中途轉行,從而加劇了這個行業的人才稀缺,國內的一些晶片設計大型企業,如海思也在模擬設計人才和模擬研發力量上有所欠缺。
雖然模擬晶片佔晶片總銷售額比例不如數字晶片,但模擬電路在信息存儲、信號採集、模/數和數/模轉換、電源、通訊、射頻等領域發揮著不可替代的重要作用,多數數字電路中都必須包含模擬電路模塊。通常這些系統中模擬電路的部分難以被數字電路取代,因此形成了高端產品。以高端模/數轉換器件(ADC)為例,美國ADI公司生產的某型號的宇航級24bit ADC的售價是20萬美元。2018年第2季度財報顯示ADI公司的毛利潤率高達68.3%(表2)。而在這超高的利潤率背後則是高端人才的積累。
2018年ADI與Ti營業收入和細分市場比較
三、晶片行業的中國機會
從晶片誕生的第一天開始,它的高製造門檻註定了能夠進入的競爭玩家不多。一直到晶圓代工廠(如臺積電、中芯國際等)的出現,純晶片設計的公司才開始慢慢發展起來。
中國由於起步晚、被歐美日國家技術封鎖等,發展比較緩慢。中國晶片設計公司想在未來突圍,必須找準自己的定位。因此,中國公司可以選擇在巨頭夾縫中生存,選擇在電源管理晶片等沒有壟斷的領域中發展,但是低門檻也意味著很多時候大家只能在靠不斷的價格戰來獲取客戶,所以利潤率難以獲得提升。
除此之外,就是海思模式,背靠大樹好乘涼,有華為這樣的資金投入,市場需求和技術支持,想設計出有競爭力的晶片也不是一個難事,但是畢竟這樣的大樹不多。
正如文章一開始提到,晶片永遠都是圍繞著通訊和計算而展開的。當今晶片業界大家都在關注IoT和AI的發展,分別代表未來通訊和計算的發展方向。IoT更多是傳統通訊技術的延伸,因此傳統通訊巨頭在這方面依然存在著人才和技術優勢。
關於AI晶片,這個對於絕大多數包括傳統晶片巨頭在內,都是一個全新領域,以至於業界對它的預期都無法統一。然而,我們更加相信AI晶片將會是一個更多元的發展。由於AI晶片的需求遠比傳統的CPU更加多元化,一個晶片把所有的計算都實現的時代已經不適合AI應用的需求,所以未來的AI晶片肯定是更加定製化的。它的市場前景廣大,國內外研發幾乎是同時起步,並且AI晶片難以被壟斷。
四、模擬計算晶片替代數字計算晶片
為什麼不能用設計數字電路的方法去設計模擬電路呢?
這其實也是數字電路和模擬電路存在一個根本性的區別,就是數字電路的冗餘度極高,也就是它天生自帶抗幹擾與噪聲的能力,而幹擾與噪聲永遠是模擬電路的一個惡夢。
簡單的說,在最常用的二進位數字電路,所有的信息都是被標記成「1」或「0」,在電路上「1」體現為高電壓(在常用的28nm工藝是0.9V),「0」體現為低電壓(一般是0V)。
因此,在實際電路上幾乎不可能出現這麼大一個噪聲或者幹擾把這信息突然改變。然而,在模擬電路裡面,如10bit的ADC,要把這個0.9V電壓切成2*10(1024)份,那麼這時候噪聲或幹擾很可能就改變原有的信息,從而產生誤差。
因為模擬晶片對噪聲和幹擾的敏感度,高精度的計算一直都是通過數字電路實現。數字電路的高精度來源於它的高冗餘度,這也意味著它的低效能。我們可以想像,如果我們用0.1V去代表信息裡面的「1」,這就意味著功耗降到了原來數字電路的10%。
能效上的優勢可以說是驅動模擬計算的唯一動力,但是在傳統的計算任務中,高精度永遠是模擬計算邁不進的門檻,因為沒有人會接受看電視節目的時候,突然出現一片噪點;也沒有人會接受用計算機計算的時候,得到的結果總是出現錯誤。
因此,數位技術一直主導計算晶片的發展歷史,但是AI應用的出現讓這個局面得到改變。首先在AI的很多應用裡面,它的輸入來身就是充滿了極大的冗餘度,就像一輛汽車的圖片,它包含的信息量是巨大的,但是最後我們想得到結果就是把它區分到車輛的種類。信息的高冗餘度意味它本身就可以抵抗幹擾和噪聲。混合信號AI晶片正是利用輸入信息的冗餘度,數字電路的高精度,模擬電路的低功耗,去實現超低功耗的AI晶片並且達到了和高功耗的純數字電路幾乎一樣的識別準確度。
在模擬—數字混合電路AI晶片領域,深圳市九天睿芯科技的ADA(Analog-Digital Acceleration)架構,就是模擬—數字混合電路領域的典型代表。該架構巧妙地將人工神經網中很大部分的運算由以往的純數字電路改變為採用模擬電路計算,因此得以充分利用模擬電路和數字電路各自的優點,產生超過主流10倍的速度和能源效率的提升。這種工作方式很大程度上與人腦的工作方式相接近。人腦用20W的功率實現了非常複雜的處理能力,這種高度的能耗效率是自然界千百萬年進化的結果,是一種優化的選擇。
該模數混合神經網絡處理器晶片具體具有以下特點:
1.對於多數數學基礎運算更高效 (信號是連續的)
2.更接近人腦工作原理
3.更加易於與原始模擬信號實現數據採集+數據處理的融合
4.在實現片上學習相關的複雜數學運算時更加有效
5.獨有的模數混合類腦晶片實現IP
6.具有超高處理能力,能效可達20-50Tops/W
目前九天睿芯在研發的模數混合神經網絡處理器晶片,分為聲音處理晶片和視覺處理晶片:
視覺處理晶片採用圖像採集+前端深度學習處理、片上分布式模擬數字混合計算存儲,擁有25~50Tops/W的超高算力和10mW~100mW的超低功耗。這種性能和功耗已經給智能設備和可穿戴設備帶來了非常大的能力提升。
超低功耗聲音處理晶片採用片上分布式模擬數字混合計算存儲,完全不依賴片外存儲。聲音處理晶片進行KWS、VAD、聲紋識別等,處理關鍵詞識別僅需 10uW,在擁有超高處理能力的同時保持最低的功率消耗。
低功耗傳感器端處理晶片正在日趨受到市場青睞。例如,索尼公司公布將要將智能處理器之植入圖像傳感器中,用來實現智能圖像傳感。在這種場景下,功耗的控制即成為一個非常重要的技術門檻。智能處理晶片的能耗的降低不僅是電池續航方面的要求,很大程度上也是圖像傳感器本身工作狀態的要求。常規的圖像傳感器在溫度超過55度時就會產生不同程度的圖像質量的下降。如果採用傳統的純數字電路的智能處理器,則會產生大量的熱量,這些熱量將給圖像傳感器和整個攝像裝置本身帶來很大的負面影響。這些需求都給模擬-數字混合處理晶片的應用帶來了巨大的空間。
在摩爾定律即將走到盡頭的今天,人工智慧的大爆發對晶片性能提出了更高的要求,但技術不會停止,只會不斷演進,模擬-數字混合電路給後摩爾定律晶片的能耗效率和性能提升帶來了新的希望。
九天睿芯科技集中了模擬/混合信號設計、神經網絡算法、數字設計等不同領域的專家來將傳統數字晶片以及馮·諾依曼架構的難題匯集在一起加以解決。以針對邊緣計算的超高能效AI硬體為目標,將計算性能和能源效率提高的機致的水平,並且通過優化設計保持了非常小的晶片尺寸。目前架構可以實現相對傳統數字電路晶片10倍能源效率的提升,並且可以完全依賴國內的半導低加工水平實現量產。這對於中國的晶片自主有巨大的推動作用。
以英特爾cpu為例,電晶體數量、主頻、功率等指標逐年變化圖
希望我們國家的晶片企業可以更多地提高創新能力,而不是簡單的進口替代,這樣才能在晶片這一高度競爭的市場走得更加穩健、自主。
深圳市九天睿芯科技有限公司(以下簡稱:九天睿芯或公司)於2018年6月在中國深圳創立,是全球高效AI晶片領域的引領者。公司致力於高效模數混合計算,促進AI應用成為主流。
公司致力於研發模數混合神經網絡處理器晶片,用主流CMOS技術實現超低功耗神經網絡處理新型架構,其獨有技術已獲得美國專利授權。目前利用此技術的模數混合神經網絡處理器晶片已成功流片,在擁有超高處理能力的同時保持最低的功率消耗,能效可達到25Tops/W,以每秒每瓦25萬億次計算,比現在絕大多數純數字AI晶片能效提高5-10倍。九天睿芯模數混合神經網絡處理器晶片還可以調節精度,適用不同應用場景,如聲音識別、人臉識別、醫療影像識別、視頻分析和無人駕駛等,是適合於未來無源無線智能物聯網的重要技術突破。
目前市場上的國產晶片多數為純數字晶片。純數字晶片提高算力主要依靠降低工藝製程,但採用低工藝製程的晶片,如7nm,成本昂貴且受制於境外生產。九天睿芯採用模擬數字混合晶片,模擬計算在實現片上學習相關的複雜數學運算時更加有效,不需要低工藝製程就能實現同等算力。
相比於全球10大模擬晶片廠商,如行業領頭羊德州儀器TI(美國)採用模擬晶片+數字dsp處理器,九天睿芯採用更先進的模擬晶片+模數混合處理器。我們朝乾夕惕,戮力成為中國的TI,從數據源最根本端實現國產化,保證數據安全。
九天睿芯博士創始團隊均來自蘇黎世聯邦理工學院(QS世界排名前十)、哥倫比亞大學、洛桑聯邦理工學院、香港中文大學、慕尼黑工業大學等,並曾就職於華為、IMEC、騰訊、Xilinx(賽靈思)、高通、ARM、中科院等國內外知名企業,具有豐富的晶片設計開發經驗和神經網絡算法及計算架構經驗,從事相關領域研發的平均時間達十年以上,並在很多頂級會議和期刊(如ISSCC / JSSC / TCAS / ISCAS / Frontiers in Neuromorphic Engineering / NIPS / SIGMOD / TODS等)上發表過文章。
九天睿芯目前在瑞士蘇黎世和中國深圳設有兩個辦公室,在職員工20餘人。