行業的聲音——中國晶片可能的突破點:模數混合計算

2020-12-05 騰訊網

  洪泰出品:

  最近晶片這一我們知之甚少,但其實平常生活中經常會用到的「小」東西火了一把。

  沒錯,晶片實體就是一個小到需要顯微鏡去觀察的東西。一個集成數十億晶體的晶片其實比我們拆開手機後蓋、經過封裝後的晶片還要小得多。然而,就是這麼一個小東西,卻承載了整個信息社會所有的算力。

  那麼未來中國在晶片領域有機會超越美國嗎?超越的突破口可能會出現在哪一技術領域?

  本文特邀行業專家、洪泰Family代表——深圳九天睿芯創始人劉洪傑及其團隊從行業角度,深度解析中國晶片發展的前景問題。關於晶片的產業鏈、晶片行業的壟斷、中國晶片的機會等大家關心的問題,都將在本文一一呈現。

  人們經常把晶片比喻成大腦,這是正確但不完整的。整個信息化社會其實都基於兩大基石,一個是計算,另一個是通訊。因此,晶片還有一個很大的功能是用在通訊上面。如果說計算晶片相當於人類的思考能力,那麼通訊晶片就相當於人類的交流能力。

  現在通訊領域所有核心晶片基本都掌握在美國兩個晶片巨頭的手中,分別是高通和博通。除此之外,一些高性能的數模轉換晶片ADC,也是被美國廠商(ADI)所壟斷。

  很多人都會有這樣的疑問,為什麼中國在很多行業取得巨大進步的今天,晶片作為國家重點發展的行業,卻難以得到發展?原因有很多,包括經濟、教育、國外技術封鎖等等。作為晶片設計的工程師,我們將從技術方面說一下自己的看法。

  一、晶片產業鏈巨大

  晶片產業最上遊是EDA軟體,然後到晶片設計晶片製造,最後是封裝測試。這四個流程中,是一環扣一環,任何一個地方出問題,最後生產出來的晶片就是廢品。

  這四個環節當中,每一個環節又需要很多產業鏈支持。如晶片製造需要的光刻機,全世界只有荷蘭AMSL能夠製造高端的光刻機。整個晶片產業鏈的廣度和深度都註定這是一個需要國際分工的產業。它所需要的尖端設備、儀器很多,所以基本上不可能由一個公司,甚至一個國家能夠獨立完成。我國晶片產業由於起步晚,尖端製造設備非常依賴於歐美、日本等國家。這也造成我國晶片行業發展之艱巨

  二、晶片設計中的三大壟斷

  作為晶片設計工程師中的一員,深感晶片產品的應用遠遠不是一個簡單的技術問題。正如前文所提到的,晶片行業的兩大基石是計算與通訊。

  生態系統壟斷

  先說計算晶片吧,最常見的是計算機裡用到的CPU。當英特爾與微軟組成Wintel聯盟之後,計算機晶片基本成為英特爾搖錢樹。其實比起CPU設計技術的本身,CPU的商業化更重要的是生態系統。一款不能兼容Windows系統的CPU,再高的技術與性能也是無濟於事。

  專利壟斷

  在通訊晶片領域,雖然不存在生態壟斷,卻到處都是專利壟斷。晶片只是實現通訊的一個載體,在這個載體之上是各種通訊協議,意味各種專利。因此,我們可以預見在5G時代,通訊晶片的玩家肯定只有幾家行業巨頭,包括高通、華為、三星等。

  技術壟斷

  最後一種是技術壟斷,就是各種模擬晶片行業巨頭,包括德州儀器,ADI等。它們以自己獨特高超的模擬晶片設計技術,賺著超高的利潤,毛利率超70%,淨利率達40%。高利潤也意味著高門檻,要不然國內早就有一堆企業進場,把價格拉低。

  優秀的模擬設計人才是模擬晶片從業公司與數字晶片從業公司之間天然的壁壘和護城河。數字(前端)工程師通常工作在架構/系統級別,對於晶片的性能有整體的認識和把握。數字晶片對工程師的要求偏廣度。模擬工程師通常工作在電路級別,需要關心電路細微的細節和具體物理的實現,對具體問題有豐富的數學模型構建能力和推導能力。

  世界前10大模擬晶片企業

  很多時候,模擬工程師需要能夠在保留所關心問題本質的前提下簡化和近似模型。有人將這種能力表達為一種「藝術」或「直覺」。實際上,這種直覺是極大程度上建立在嚴謹的數學基礎上,是長期大量經驗積累的結果。這就造成了模擬電路工程師成長周期緩慢。

  有人曾說,10年以內經驗的模擬工程師並不能稱為優秀的模擬電路工程師。很多原本的模擬電路工程師中途轉行,從而加劇了這個行業的人才稀缺,國內的一些晶片設計大型企業,如海思也在模擬設計人才和模擬研發力量上有所欠缺。

  雖然模擬晶片佔晶片總銷售額比例不如數字晶片,但模擬電路在信息存儲、信號採集、模/數和數/模轉換、電源、通訊、射頻等領域發揮著不可替代的重要作用,多數數字電路中都必須包含模擬電路模塊。通常這些系統中模擬電路的部分難以被數字電路取代,因此形成了高端產品。以高端模/數轉換器件(ADC)為例,美國ADI公司生產的某型號的宇航級24bit ADC的售價是20萬美元。2018年第2季度財報顯示ADI公司的毛利潤率高達68.3%(表2)。而在這超高的利潤率背後則是高端人才的積累。

  2018年ADI與Ti營業收入和細分市場比較

  三、晶片行業的中國機會

  從晶片誕生的第一天開始,它的高製造門檻註定了能夠進入的競爭玩家不多。一直到晶圓代工廠(如臺積電、中芯國際等)的出現,純晶片設計的公司才開始慢慢發展起來。

  中國由於起步晚、被歐美日國家技術封鎖等,發展比較緩慢。中國晶片設計公司想在未來突圍,必須找準自己的定位。因此,中國公司可以選擇在巨頭夾縫中生存,選擇在電源管理晶片等沒有壟斷的領域中發展,但是低門檻也意味著很多時候大家只能在靠不斷的價格戰來獲取客戶,所以利潤率難以獲得提升。

  除此之外,就是海思模式,背靠大樹好乘涼,有華為這樣的資金投入,市場需求和技術支持,想設計出有競爭力的晶片也不是一個難事,但是畢竟這樣的大樹不多。

  正如文章一開始提到,晶片永遠都是圍繞著通訊和計算而展開的。當今晶片業界大家都在關注IoT和AI的發展,分別代表未來通訊和計算的發展方向。IoT更多是傳統通訊技術的延伸,因此傳統通訊巨頭在這方面依然存在著人才和技術優勢。

  關於AI晶片,這個對於絕大多數包括傳統晶片巨頭在內,都是一個全新領域,以至於業界對它的預期都無法統一。然而,我們更加相信AI晶片將會是一個更多元的發展。由於AI晶片的需求遠比傳統的CPU更加多元化,一個晶片把所有的計算都實現的時代已經不適合AI應用的需求,所以未來的AI晶片肯定是更加定製化的。它的市場前景廣大,國內外研發幾乎是同時起步,並且AI晶片難以被壟斷。

  四、模擬計算晶片替代數字計算晶片

  為什麼不能用設計數字電路的方法去設計模擬電路呢?

  這其實也是數字電路和模擬電路存在一個根本性的區別,就是數字電路的冗餘度極高,也就是它天生自帶抗幹擾與噪聲的能力,而幹擾與噪聲永遠是模擬電路的一個惡夢

  簡單的說,在最常用的二進位數字電路,所有的信息都是被標記成「1」或「0」,在電路上「1」體現為高電壓(在常用的28nm工藝是0.9V),「0」體現為低電壓(一般是0V)。

  因此,在實際電路上幾乎不可能出現這麼大一個噪聲或者幹擾把這信息突然改變。然而,在模擬電路裡面,如10bit的ADC,要把這個0.9V電壓切成2*10(1024)份,那麼這時候噪聲或幹擾很可能就改變原有的信息,從而產生誤差

  因為模擬晶片對噪聲和幹擾的敏感度,高精度的計算一直都是通過數字電路實現。數字電路的高精度來源於它的高冗餘度,這也意味著它的低效能。我們可以想像,如果我們用0.1V去代表信息裡面的「1」,這就意味著功耗降到了原來數字電路的10%。

  能效上的優勢可以說是驅動模擬計算的唯一動力,但是在傳統的計算任務中,高精度永遠是模擬計算邁不進的門檻,因為沒有人會接受看電視節目的時候,突然出現一片噪點;也沒有人會接受用計算機計算的時候,得到的結果總是出現錯誤。

  因此,數位技術一直主導計算晶片的發展歷史,但是AI應用的出現讓這個局面得到改變。首先在AI的很多應用裡面,它的輸入來身就是充滿了極大的冗餘度,就像一輛汽車的圖片,它包含的信息量是巨大的,但是最後我們想得到結果就是把它區分到車輛的種類。信息的高冗餘度意味它本身就可以抵抗幹擾和噪聲。混合信號AI晶片正是利用輸入信息的冗餘度,數字電路的高精度,模擬電路的低功耗,去實現超低功耗的AI晶片並且達到了和高功耗的純數字電路幾乎一樣的識別準確度。

  在模擬—數字混合電路AI晶片領域,深圳市九天睿芯科技的ADA(Analog-Digital Acceleration)架構,就是模擬—數字混合電路領域的典型代表。該架構巧妙地將人工神經網中很大部分的運算由以往的純數字電路改變為採用模擬電路計算,因此得以充分利用模擬電路和數字電路各自的優點,產生超過主流10倍的速度和能源效率的提升。這種工作方式很大程度上與人腦的工作方式相接近。人腦用20W的功率實現了非常複雜的處理能力,這種高度的能耗效率是自然界千百萬年進化的結果,是一種優化的選擇。

  該模數混合神經網絡處理器晶片具體具有以下特點:

  1.對於多數數學基礎運算更高效 (信號是連續的)

  2.更接近人腦工作原理

  3.更加易於與原始模擬信號實現數據採集+數據處理的融合

  4.在實現片上學習相關的複雜數學運算時更加有效

  5.獨有的模數混合類腦晶片實現IP

  6.具有超高處理能力,能效可達20-50Tops/W

  目前九天睿芯在研發的模數混合神經網絡處理器晶片,分為聲音處理晶片和視覺處理晶片:

  視覺處理晶片採用圖像採集+前端深度學習處理、片上分布式模擬數字混合計算存儲,擁有25~50Tops/W的超高算力和10mW~100mW的超低功耗。這種性能和功耗已經給智能設備和可穿戴設備帶來了非常大的能力提升。

  超低功耗聲音處理晶片採用片上分布式模擬數字混合計算存儲,完全不依賴片外存儲。聲音處理晶片進行KWS、VAD、聲紋識別等,處理關鍵詞識別僅需 10uW,在擁有超高處理能力的同時保持最低的功率消耗。

  低功耗傳感器端處理晶片正在日趨受到市場青睞。例如,索尼公司公布將要將智能處理器之植入圖像傳感器中,用來實現智能圖像傳感。在這種場景下,功耗的控制即成為一個非常重要的技術門檻。智能處理晶片的能耗的降低不僅是電池續航方面的要求,很大程度上也是圖像傳感器本身工作狀態的要求。常規的圖像傳感器在溫度超過55度時就會產生不同程度的圖像質量的下降。如果採用傳統的純數字電路的智能處理器,則會產生大量的熱量,這些熱量將給圖像傳感器和整個攝像裝置本身帶來很大的負面影響。這些需求都給模擬-數字混合處理晶片的應用帶來了巨大的空間。

  在摩爾定律即將走到盡頭的今天,人工智慧的大爆發對晶片性能提出了更高的要求,但技術不會停止,只會不斷演進,模擬-數字混合電路給後摩爾定律晶片的能耗效率和性能提升帶來了新的希望。

  九天睿芯科技集中了模擬/混合信號設計、神經網絡算法、數字設計等不同領域的專家來將傳統數字晶片以及馮·諾依曼架構的難題匯集在一起加以解決。以針對邊緣計算的超高能效AI硬體為目標,將計算性能和能源效率提高的機致的水平,並且通過優化設計保持了非常小的晶片尺寸。目前架構可以實現相對傳統數字電路晶片10倍能源效率的提升,並且可以完全依賴國內的半導低加工水平實現量產。這對於中國的晶片自主有巨大的推動作用

  以英特爾cpu為例,電晶體數量、主頻、功率等指標逐年變化圖

  希望我們國家的晶片企業可以更多地提高創新能力,而不是簡單的進口替代,這樣才能在晶片這一高度競爭的市場走得更加穩健、自主。

  深圳市九天睿芯科技有限公司(以下簡稱:九天睿芯或公司)於2018年6月在中國深圳創立,是全球高效AI晶片領域的引領者。公司致力於高效模數混合計算,促進AI應用成為主流。

  公司致力於研發模數混合神經網絡處理器晶片,用主流CMOS技術實現超低功耗神經網絡處理新型架構,其獨有技術已獲得美國專利授權。目前利用此技術的模數混合神經網絡處理器晶片已成功流片,在擁有超高處理能力的同時保持最低的功率消耗,能效可達到25Tops/W,以每秒每瓦25萬億次計算,比現在絕大多數純數字AI晶片能效提高5-10倍。九天睿芯模數混合神經網絡處理器晶片還可以調節精度,適用不同應用場景,如聲音識別、人臉識別、醫療影像識別、視頻分析和無人駕駛等,是適合於未來無源無線智能物聯網的重要技術突破。

  目前市場上的國產晶片多數為純數字晶片。純數字晶片提高算力主要依靠降低工藝製程,但採用低工藝製程的晶片,如7nm,成本昂貴且受制於境外生產。九天睿芯採用模擬數字混合晶片,模擬計算在實現片上學習相關的複雜數學運算時更加有效,不需要低工藝製程就能實現同等算力。

  相比於全球10大模擬晶片廠商,如行業領頭羊德州儀器TI(美國)採用模擬晶片+數字dsp處理器,九天睿芯採用更先進的模擬晶片+模數混合處理器。我們朝乾夕惕,戮力成為中國的TI,從數據源最根本端實現國產化,保證數據安全。

  九天睿芯博士創始團隊均來自蘇黎世聯邦理工學院(QS世界排名前十)、哥倫比亞大學、洛桑聯邦理工學院、香港中文大學、慕尼黑工業大學等,並曾就職於華為、IMEC、騰訊、Xilinx(賽靈思)、高通、ARM、中科院等國內外知名企業,具有豐富的晶片設計開發經驗和神經網絡算法及計算架構經驗,從事相關領域研發的平均時間達十年以上,並在很多頂級會議和期刊(如ISSCC / JSSC / TCAS / ISCAS / Frontiers in Neuromorphic Engineering / NIPS / SIGMOD / TODS等)上發表過文章。

  九天睿芯目前在瑞士蘇黎世和中國深圳設有兩個辦公室,在職員工20餘人。

相關焦點

  • ...神經擬態模數混合計算晶片行業的領軍者,開拓感存算一體架構晶片
    【編者按】2021中國IC風雲榜「年度最具成長潛力獎」徵集現已啟動!入圍標準要求為營收500萬-1億元的未上市、未進入IPO輔導期的半導體行業優秀企業。評選將由中國半導體投資聯盟129家會員單位及400多位半導體行業CEO共同擔任評選評委。獎項的結果將在2021年1月份中國半導體投資聯盟年會暨中國IC 風雲榜頒獎典禮上揭曉。
  • 「超速」的模數混合加速晶片
    2018年的中興事件使創始團隊意識到,國內正在面對因晶片技術落後而帶來的限制問題,於是短短幾個月後,九天睿芯決定將總部從瑞士遷至中國深圳,同時,調整戰略方向,從初期以AI晶片研發為主,逐漸調整為同時布局超高速ADC。下一步,他們會將ADC部分和模數混合處理部分融合,集成在一塊晶片上,提高晶片效率,並從數據源最根本端做處理,降低系統數據傳輸量以及處理延時。
  • 齒輪「模數」是如何計算的?
    直齒、斜齒和圓錐齒齒輪的模數皆可參考標準模數系列表。    工業定義:齒輪的分度圓是設計、計算齒輪各部分尺寸的基準,而齒輪分度圓的周長=πd=z p,於是得分度圓的直徑 d=z p/π。徑節制齒輪    在一些國家裡,不同模數使用徑節作為齒輪的基本參數,用英寸為計量單位,徑節以P表示,指圓周率π與齒距ρ的比,徑節P=π/ρ,以 1/英寸為單位。
  • 計算齒輪模數的小技巧
    今天分享一個小技巧,很多同志剛工作的時候拿到一顆齒輪,卻只會數齒數,計算不好模數。今天就來說說怎麼快速計算齒輪的模數。
  • 標準齒輪模數計算公式
    模數表示輪齒的大小。R模數是分度圓齒距與圓周率(π)之比,單位為毫米(mm)。除模數外,表示輪齒大小的還有CP(周節:Circular pitch)與DP(徑節:Diametral pitch)。這種計算方法針對所有的模數齒輪(不包括變位齒輪)。
  • 晶片行業深度報告:為什麼說ARM可能是國產計算架構的最優選擇
    我國在這些核心技術,特別最底層的 核心晶片領域的技術缺位,導致近年來頻繁受到美國技術霸權的欺壓。比 如自 2016 年開始,美國對我國中興和華為兩大通信巨頭不斷打壓,延緩兩 家企業發展,並逐漸升級為國家間的技術較量。發展我國創新可信的底層 計算晶片擺脫「卡脖子」問題,已然不僅僅是企業和行業的發展需要,而 是上升為國家層面的戰略需求。
  • C家精講 | 熱模數計算基礎與Cast-Designer中的熱模數
    【第二季,第40期】熱模數計算基礎與Cast-Designer中的熱模數
  • 專家把脈小模數齒輪行業發展新動向
    11月29日,「2020年CGMA小模數齒輪技術研討會」在我市召開。會議由中國機械工業聯合會指導,中國機械通用零部件工業協會齒輪與電驅動分會(CGMA)主辦,中山邁雷特數控技術有限公司承辦 。會議吸引了來自國內外齒輪界150多家企業、院校、研究所專家學者、代表廣泛交流。 副市長雷嶽龍出席相關活動。
  • 模數混合電路的電源和接地布局原則
    打開APP 模數混合電路的電源和接地布局原則 發表於 2019-10-12 14:35:38   對於模數混合電路來說,電源和接地的PCB布局是很重要的。
  • 落地AI智慧賦能、鍛造晶片製造基石,芯力量初賽等你參與!
    億智電子:邊緣計算AI SoC晶片全棧解決方案隨著設備智能化趨勢演進,據IDC數據顯示,AI算法模型日益成熟,從2022年起,中國AI推理市場支出將開始超越AI訓練市場。億智自研AI SoC晶片面向邊緣計算應用場景設計,已於2019年量產,應用於安防、汽車後端市場、智能硬體AIoT等領域。
  • 齒輪的「模數」是什麼?
    模數是決定齒輪大小的因素。齒輪模數被定義為模數制輪齒的一個基本參數,是人為抽象出來用以度量輪齒規模的數。目的是標準化齒輪刀具,減少成本。直齒、斜齒和圓錐齒齒輪的模數皆可參考標準模數系列表。工業定義:齒輪的g度圓是設計、計算齒輪各部分尺寸的基準,而齒輪分度圓的周長=πd=z p,於是得分度圓的直徑 d=z p/π。
  • ArcGIS計算土壤侵蝕模數(三)土壤可蝕性因子K計算
    本次採用中國土壤流失方程CSLE計算土壤侵蝕模數,計算公式為: A=RKLSBET 式中,式中:A—土壤侵蝕模數。
  • 國產模數轉換ADC晶片的現狀、困境和歷史機遇
    自然界產生的信號,都是模擬信號,比如我們說話的聲音,看到的景色,感受到的溫度、溼度、壓力、流速、光、電、風及個人的呼吸、血壓、體溫、心跳、體重、血糖,體脂等等。        這些模擬信號都得最終放在電腦,手機等數字領域進行處理,存儲或者傳輸,那如何把模擬信號轉換成數位訊號呢?就需要一個轉換器晶片,它就是晶片界的翹楚—ADC!
  • 國產模數轉換 ADC 晶片的現狀、困境和歷史機遇
    5、GS/s高精度的模數轉換器(ADC)是5G通訊建設中高性能基站的核心器件,也是反導相控陣雷達中所需的關鍵模塊,更是「瓦森納協議」所禁運管控的核心器件,長期以來被國外公司所壟斷,突破GS/s高精度ADC的技術壁壘迫在眉睫。
  • 百度王海峰出席中國認知計算和混合智能學術大會 深度解析「多模態...
    8月25日,為期兩天的首屆中國認知計算和混合智能學術大會(CCHI2018)在西安舉辦,百度高級副總裁、AI技術平臺體系(AIG)總負責人王海峰與中國科學院院士陳霖、蒲慕明等學界知名專家共同研討與交流認知科學、神經科學與人工智慧學科領域交叉融合的最新進展和前沿技術。
  • 解密:畢馬威中國晶片新銳50強!
    在DRAM領域,三星、海力士及美光為行業龍頭,在NAND領域,三星、東芝、新帝,海力士以及美光、英特爾共同掌握全球話語權。  當前,中國已初步完成在存儲晶片領域的戰略布局,但由於中國起步晚,且受到技術封鎖,市場份額較少,距離全面國產替代還有較大的發展空間。存儲晶片良好的發展態勢將為中國在這一領域的發展提供源源不斷的需求保障。
  • 怎麼比較快的計算F77齒輪減速機的齒輪模數?
    怎麼比較快的計算F77齒輪減速機的齒輪模數?在選擇減速機的時候經常有人問你們這款減速機裡面的齒輪模數是多少的?怎麼計算呢?今天就來推薦一些比較簡單的方法,希望對你有用!現在介紹一種比較簡單的方法測量齒輪的模數。在測繪一個大型斜齒輪軸時,由於軸伸過長及缺乏專用的測量工具,齒根圓直徑無法測得,只測得齒項直徑d。m=112mm,齒數x=16。
  • 陝西國際商貿學院學子在第七屆大學生模擬及模數混合電路應用設計...
    近日,陝西省第七屆大學生模擬及模數混合電路應用設計競賽舉行,陝西國際商貿學院信息工程學院學子在此項競賽中斬獲5個獎項,同時該校被授予優秀組織單位獎,信息工程學院王麗君老師獲得優秀組織個人。大學生模擬及模數混合電路應用設計競賽是陝西省教育廳舉辦,競賽旨在深化電子信息類專業教學改革,提高大學生創新意識和實踐能力的學科競賽。為確保能取得優異成績,該校信息工程學院教師積極組織指導學生進行競賽活動,在四天三夜緊張工作部署,通過對競賽題目的討論和方案確定、電路系統設計、焊接及調試,最終在測試環節中取得優異的成績。
  • 計算速度是電子晶片1000倍,光子AI晶片商用產品今年面世!
    他認為,即使是在實際應用中,該款演示的光子計算晶片將擊敗AI加速領域的市場領導者——英偉達A100 GPU。 光子算數也是國內國內少有的光子AI晶片賽道玩家,該公司與高校一起打造了面向伺服器的光電混合AI加速計算卡,目前已完成一些定製化加速任務,包括機器學習推理、時間序列分析等特定任務。
  • 量子計算總是混合的,這需要不斷協調
    現代計算革命是由中央處理器(CPU)的發展推動的,隨著時間的推移,CPU變得更小、更複雜。這種發展最終形成了微處理器,今天我們使用的CPU的主要形式。在這個過程中,出現了更專業的晶片——圖形處理器(GPU)、現場可編程門陣列(FPGA)和專用集成電路(ASIC)。