來源:本文轉載自公眾號網絡交換FPGA ,作者:西南交通大學研究生導師邸志雄博士,謝謝。
電子裝備系統是星鏈、火星探測器、玉兔、嫦娥等太空飛行器的重要支撐,而宇航級晶片則是航天航空電子裝備的心臟。
江湖中流傳這樣一個傳說,Xilinx的一款宇航級FPGA晶片,其單價約500萬元,為史上最貴晶片。
這個傳說並不是說完全沒有依據,宇航級晶片必須具備抗輻照特性,其身價往往是我們生活中常見的消費級晶片的數十倍,甚至成百上千倍。那麼,與消費級晶片相比,這些昂貴的宇航級晶片在設計階段有什麼特別之處呢?
在太空飛行器運行的空間環境中,存在著大量的高能粒子和宇宙射線。這些粒子和射線會穿透太空飛行器屏蔽層,與元器件的材料相互作用產生輻射效應,引起器件性能退化或功能異常,影響太空飛行器的在軌安全。引起器件輻射效應的主要空間輻射源包括地球輻射帶、銀河宇宙射線、太陽宇宙線和人工輻射。
其中,對晶片工作影響最為嚴重的輻射效應當屬「單粒子效應」。
據數據統計,從 1971 年到 1986 年間,國外發射的 39 顆同步衛星共發生了 1589 次故障,有 1129 次故障與空間輻射有關,且其中的 621 次故障是由於單粒子效應導致的。這些統計數據說明了航天應用中電子器件的主要故障來自於空間輻射,而單粒子效應導致的故障在其中佔較大比重。
這些故障中,部分是永久性不可逆的,如發生單粒子鎖定導致晶片內部局部短路從而產生大電流燒毀器件。針對此類錯誤可以應用一些特定工藝或器件庫來避免。而太空中大部分錯誤是由於半導體器件的邏輯狀態跳變而導致的可恢復的錯誤,如單粒子翻轉導致存儲器存儲內容錯誤。
單粒子翻轉(Single-Event Upsets,SEU)指的是元器件受輻照影響引起電位狀態的跳變,「0」變成「1」,或者「1」變成「0」,但一般不會造成器件的物理性損傷。正因為「單粒子翻轉」頻繁出現,因此在晶片設計階段需要重點關注。這也是這篇文章的重點。
(1) 選擇合適的工藝製程
在航天領域,並不是工藝製程越小越好。通常來講,工藝製程越小,抗輻照能力越差。因此,為了確保可靠性,一般會選擇較大線寬的製程,比如0.18um、90nm、65nm等,而不會一味追求摩爾定律的前沿製程。
(2)加固標準單元工藝庫
標準單元工藝庫是數字晶片的基石。如果把數字晶片看做一個建築,標準單元工藝庫就是構成建築的磚塊。標準單元工藝庫包括反相器、與門、寄存器、選擇器、全加器等多種基本單元,每一個標準單元對應著多個不同尺寸(W/L)、不同驅動能力的單元電路,基於這些基本單元即可構成複雜的數字晶片。
鑑於數字晶片的超大規模,已經很難通過全定製電路結構的方式來設計,而直接對商用工藝庫進行加固則是設計成本最低的選擇。在製造廠商提供的標準單元庫基礎上結合抗輻照加固措施,使設計出來的輸入輸出單元庫具有抗輻照能力。加固之後的工藝庫需要晶圓廠流片驗證。
(3)設計冗餘化
在抗輻照加固方法中,三模冗餘(TMR)是最具有代表的容錯機制。同一時間三個功能相同的模塊分別執行一樣的操作,鑑於單粒子翻轉瞬時僅能打翻1路,「三選二」的投票器將會選出其餘兩路的正確結果,增強電路系統的可靠性。三模冗餘最顯著優點是糾錯能力強,且設計簡單,大大提高電路可靠性;但缺點也是顯而易見,會將電路增大3倍以上。TMR的方法較為靈活,可根據性能需求在寄存器級、電路級、模塊級等任意層次設計TMR,部分EDA工具也可自動插入。
錯誤檢測與糾正電路(Error Detection And Correction,EDAC)也是一種簡單高效的防護單粒子翻轉的電路設計方法。EDAC 主要依據檢錯、糾錯的原理,通過轉換電路將寫入的數據生成校驗碼並保存,當讀出時靠對校驗碼進行判定,若只有一位出錯系統則自動糾正並將正確的數據輸出,同時還會進行數據的回寫從而覆蓋原來出錯的數據。EDAC儘管糾錯能力強大,但是需要糾錯、解碼電路,因此結構較為複雜,不適宜用於高性能的數據通道中。EDAC也可用於糾正多bit出錯的情況,但是糾錯電路會更加複雜。
權衡TMR和EDAC的優缺點,通常會在邏輯電路設計中使用TMR,在存儲器讀寫電路中使用EDAC。
(4)模塊獨立化
單粒子翻轉頻繁出現,必須考慮到翻轉發生之後不影響晶片的整體功能。因此,在架構設計中需要儘可能確保模塊之間保持較強的獨立性,儘可能具備獨立的復位功能,使得在單粒子打翻信號值之後,一方面出錯電路能夠儘快通過復位信號恢復正常;另一方面,確保其他正常工作的模塊不受影響。此外,還需增加異常檢測電路,發現異常即可對電路進行復位。
雖然上述方法可以很好地防護單粒子翻轉效應,但是也給邏輯綜合、布局布線帶來很多困擾,在晶片物理實現過程中需要小心謹慎應對。除上述方法外,還可引入Muller C單元、雙互鎖存儲單元結構(DICE)對電晶體級電路進行防護,也可在版圖階段使用環形柵替換條形柵。
總之,在航天領域中,晶片的性能並不是第一考慮要素,可靠性才是重中之重。只有晶片具備抗輻照能力,才能確保太空飛行器正常運行。
*免責聲明:本文由作者原創。文章內容系作者個人觀點,半導體行業觀察轉載僅為了傳達一種不同的觀點,不代表半導體行業觀察對該觀點讚同或支持,如果有任何異議,歡迎聯繫半導體行業觀察。
今天是《半導體行業觀察》為您分享的第2486期內容,歡迎關注。
存儲|晶圓|CMOS|FPGA|射頻|臺積電|中國芯|華為