亞閾值數字標準單元庫設計

2021-01-09 電子產品世界

作者 史興榮 何進 張九柏 張子驥 賀雅娟 電子科技大學電子科學與工程學院(成都 610054)

本文引用地址:http://www.eepw.com.cn/article/201810/393368.htm

  史興榮 (1990-),男,碩士研究生,研究方向:低功耗數字集成電路設計

  賀雅娟 (1978-),女,副教授,研究方向:專用集成電路與系統、超低壓超低功耗數字集成電路設計等。

摘要:基於對0.18 μm標準CMOS工藝的研究,本文設計了一套完備的電源電壓為0.4 V的亞閾值數字標準單元庫。設計流程包括工藝研究與方案設計、單元設計與物理實現、庫文件的提取以及單元庫驗證。提出了傳統溝道寬度調節與溝長偏置相結合的尺寸調整策略,有效增強PMOS管驅動並減小漏電流,提升庫單元穩定性。利用ISCAS基準測試電路完成亞閾值標準單元庫的驗證,0.4 V電壓下,相同設計,基於亞閾值數字標準單元庫的設計的相比於基於商用庫的設計,能耗減小20%以上,數據延時也有所減小,即亞閾值標準單元庫性能明顯優於商用庫相比。

0 引言

  隨著集成電路工藝技術的不斷發展,工藝線寬不斷減小以追求高集成度與高速度,帶來的最大問題就是功率密度的不斷增大,功耗過高問題逐漸成為限制集成電路發展的重要原因。近年來興起的無線傳感網絡、醫療電子和可攜式消費電子等熱門領域,對功耗要求越來越高,低功耗技術成為工業界和學術界研究的焦點。

  在CMOS數字電路中,系統功耗包含動態功耗和靜態功耗,動態功耗與供電電壓的平方成正比,靜態功耗與供電電壓成正比,因此降低供電電壓是降低功耗最有效的方法,1970年以來,極低電壓設計技術的研究被廣泛展開。其中亞閾值電路設計技術,通過將系統電源電壓降低至器件亞閾值區域以獲得極低的系統總功耗,屬於系統級低功耗技術,能達到更好的降低功耗的效果,因此成為目前研究的熱點。

  大規模數字集成電路是基於標準單元庫或者門陣列完成設計,要實現大規模亞閾值數字電路的實現,我就需要建立亞閾值數字標準單元庫與亞閾值SRAM,針對亞閾值電壓,對基本的邏輯門(與門、或門、非門、選擇器、加法器等)以及SRAM單元進行設計和優化,使其在亞閾值下達到最優性能,進而提升整體電路性能。

  本文基於0.18 μm標準工藝,首先分析了亞閾值下NMOS和PMOS失配增大的問題,並基於數字標準單元庫設計流程與亞閾值單元庫設計設計方法的研究,提出了傳統溝道寬度調節與溝長偏置相結合的尺寸調整策略,在此基礎上設計了一套電源電壓為0.4 V的定製化亞閾值數字標準單元庫,基於該亞閾值數字標準單元庫完成數字集成電路的設計,並以ISCAS基準測試電路為載體對該亞閾值庫與原商用庫在0.4 V電壓下重新特徵化的單元庫進行了對比,驗證了該亞閾值數字標準單元庫的完備性與功能正確性,並且在功耗和性能方面相比原商用庫有很大改善。

1 標準單元庫設計流程

  數字標準單元庫的設計就是基於Foundry提供的工藝庫,定製完成基本邏輯單元的電路和版圖設計,並提取相應的時序和物理信息形成文件,供綜合工具和物理實現工具調用以完成數字集成電路的設計和分析。設計流程包括工藝研究分析、單元電路和版圖設計、單元庫建模和庫文檔生成、和單元庫評估驗證。

  圖1所示是本次亞閾值數字標準單元庫設計的流程及具體實施示意圖,在電路設計前,首先了解和研究該工藝的基本特性,包括電晶體電流電壓特性、器件的漏極電流等參數隨溝道長度和溝道寬度的變化情況,以及PMOS和NMOS的驅動強弱等,這些基於Virtuoso完成。其次,基於Virtuoso平臺完成工藝研究分析以及電路圖版圖的設計,並基於Calibre完成單元電路網表的提取。然後,利用Liberate基於單元網表完成時序庫建模,基於版圖用Abstract完成物理庫建模,用Library Compiler完成仿真庫文件的生成,以及符號庫、時序庫和物理庫文件的格式轉換。最後,用綜合和布局布線工具實現基準電路的設計,完成亞閾值庫的驗證工作。

2 理論研究與工藝分析

  2.1 最小能量點理論

  亞閾值電路的理論基礎就是最小能量點理論,電路總能耗包含動態能耗和動態能耗,動態能耗隨著供電電壓的減小呈平方關係減小,靜態能耗與時鐘周期、漏電流和供電電壓成正比,隨著電源電壓的減小,尤其是在器件閾值電壓下,時鐘周期呈指數上升,導致漏電能耗迅速增大。由此,對於特定工藝下的電路,隨著電源電壓的減小,動態能耗不斷減小,而靜態能耗先增大,存在某一特定電源電壓值,使得總能耗最小,即最小能量點,且最小能量點對應的電源電壓一般在亞閾區。

  為驗證最小能量點理論及確定亞閾值標準單元庫的電源電壓,針對所涉及的工藝,設計了驗證電路。驗證電路包含10條50級的反相器鏈,通過給定10條鏈路不同的輸入來控制開關活動性的大小,大小可以設定為0.1、0.2、……、1.0。如圖2所示,分別是開關活動因子asw等於0.1和1時不同電壓下的系統總功耗隨電源電壓變化曲線,可以看出,最小能耗點分布在電源電壓為0.2 V~0.4 V範圍內。本設計中,考慮到系統穩定性及數字單元庫的適用範圍,電源電壓設定為0.4 V。

  2.2 電晶體電流電壓特性

  NMOS和PMOS的驅動能力是不一樣的,即存在不匹配,在標準電壓下(即超閾值電壓),NMOS的驅動能力約為PMOS驅動能力的兩倍,這得益於電子遷移率為空穴遷移率兩倍多,在建立標準單元庫時,單元設計時就要考慮到NMOS/PMOS失配,通過尺寸調節來實現單元的上拉下拉匹配。但是在亞閾值電壓下,由MOS模型分析可知,NMOS/PMOS失配會增大,因此將商用標準單元庫運用到低壓電路中,電路性能會嚴重下降,會出現噪聲容限下降,抗工藝波動能力下降,甚至邏輯誤判導致電路無法正常工作等。

  對相同尺寸的NMOS管和PMOS管進行仿真,電晶體的開啟電流和關斷電流隨電源電壓的變化曲線,如圖3所示,隨著電源電壓的不斷減小,NMOS管和PMOS管的開啟電流和關斷電流都不斷減小,但是NMOS與PMOS的開啟電流之比卻在不斷增大,在電壓為0.4 V時,大尺寸管PMOS/NMOS開啟電流比已接近於7,而對於最小尺寸管,甚至高達20,即PMOS和NMOS存在嚴重的不匹配,這給我們標準單元設計時上拉下拉平衡造成很大困難。

  2.3 反短溝道效應

  隨著工藝尺寸的不斷減小,亞閾值電壓下,電晶體電流表現出明顯的反短溝道效應,隨著溝道長度L的變化,電晶體的開啟電流表現出先增大後減小的變化趨勢,即存在最優溝道長度。針對本工藝,通過對NMOS管和PMOS管的仿真發現,NMOS管開啟電流不存在反短溝道效應,而PMOS管開啟電流存在明顯的反短溝道效應,即開啟電流I_on隨著溝道長度LP的增大先增大後減小,如圖4所示,可以看出NMOS管開啟電流在LP=200 nm時達到最大。進一步研究發現,最優溝道長度與溝道寬度相關,且增大LP存在面積和漏電流增大的不良影響,因此在實際庫單元設計時,我們將NMOS的溝道長度取值為180 nm,即最小溝道長度,PMOS的溝道長度取值為190 nm,即溝道增量約為最小溝道長度的5%。

3 亞閾值庫的設計

  3.1 單元類型選擇與結構設計

  標準單元庫設計中,庫單元的和數量影響著綜合工具在映射和優化過程的有效應,庫單元種類越豐富,電路的優化就越充分。對於亞閾值標準單元庫,由於電源電壓較低,有些複雜單元不能工作,有些單元能工作但是穩定性大幅度下降,為保證功能正常且具有足夠的穩定性,則需要對這些單元進行選擇。選用扇入比較小的邏輯單元,剔除NAND4、NOR4等扇入大的邏輯,而時序優化單元較複雜且功耗較大也需要剔除,觸發器和鎖存器必不可少,但是其種類可以簡化,時鐘樹邏輯單元和物理實現單元必不可少。每種邏輯又包含多種不同驅動能力,也設計了低功耗單元,對於OR2、NOR2等穩定性差的單元,為保證單元穩定性沒有設計低功耗單元。

  對於INV、NAND2、NOR2等簡單的庫單元,直接採用傳統的靜態互補CMOS結構,而對於MX、XOR、XNOR、DFF和LATCH等比較複雜單元,傳統互補CMOS結構在亞閾值電壓下穩定性不足。因此需要改變結構,採用在低壓下性能更好的傳輸門結構設計。以二選一選擇單元MX2為例說明傳輸門結構的優勢,圖5所示是MX2單元電路結構(a)互補CMOS結構(b)傳輸門結構。在互補CMOS結構中,有兩個PMOS串聯的結構,PMOS在低壓下驅動很小,相同電晶體尺寸會導致單元穩定性較差,且單元延時較大。傳輸門結構MX2單元由傳輸門和反相器構成,沒有PMOS串聯或NMOS串聯結構,能夠工作在較低電壓,穩定性更高。傳輸門速度由NMOS管決定,延時更小,且可以採用最小尺寸電晶體完成設計,功耗小。

  3.2 單元尺寸設計策略

  標準單元尺寸設計,就是希望找到最優的尺寸組合,以使電路在功能正確的前提下,實現延時、功耗和面積的兼顧。基於前面第三章對工藝的分析可知,本工藝庫PMOS管存在明顯的電流反短溝道效應,即隨著柵極長度L的增大電流先更大後減小,存在最優L值,所以採用傳統柵極寬度W調節策略與柵極長度L偏置相結合的尺寸調節策略:

  (1)針對PMOS存在電流反短溝道效應,進一步仿真發現最優L值與電晶體柵極寬度W相關,但變化比較小,因此為簡化單元仿真量,PMOS管的柵極長度統一設定為190 nm,NMOS管的柵極長度統一設定為180 nm。

  (2)根據0.4V電壓下的NMOS/PMOS驅動比,和具體單元的結構分析,以上拉網絡和下拉網絡的匹配為目標,確定PMOS和NMOS的柵極寬度W的大致範圍。

  (3)通過分析單元的功耗、延時和面積等參數,確定單元的優化目標函數為f(P, D)=Pi*D,P是單元功耗,由於功耗與面積正相關,也包含了對面積的考慮,D為單元延時,延時為上升下降延時的平均值,考慮了上拉網絡和下拉網絡的平衡以及單元穩定性。i為調節係數,用於調節單元功耗和單元延時的比重,此處i取值為1。調整單元中各電晶體柵極寬度W,使得目標函數達到最優,確定出單元的最優尺寸。

4 亞閾值庫的評估驗證

  4.1 單元庫穩定性評估

  靜態噪聲容限是衡量單元穩定性的重要參數,測量不同邏輯單元的靜態噪聲容限,來評估我們設計的亞閾值庫的單元穩定性。圖6所示是不同邏輯單元的靜態噪聲容限,可以看出由於其PMOS管串聯的結構特性,庫中NOR2單元的靜態噪聲容限最小,為142 mV,佔電源電壓的35.5%,證明我們的庫單元可以工作在很低電壓下,單元庫具有很好的穩定性。

  4.2 單元庫的驗證

  本次為了驗證所建立的亞閾值單元庫的功能和性能,採用ISCAS85和ISCAS89基準測試電路,選取了典型的五個電路,其中C7552選自ISCAS85是純組合邏輯電路,其餘四個電路選自ISCAS89是時序電路。同時對標準單元的單元庫在0.4 V電壓下進行重新特徵化,記為商用0.4 V庫,用於和亞閾值庫對比。分別基於亞閾值庫和商用0.4 V庫,完成上述所選基準測試電路的設計,仿真對比結果如表1所示,表1中顯示,基於亞閾值庫的設計在延時和功耗方面都要明顯優於商用0.4 V庫,動態功耗和靜態功耗都減小了20%以上,且延時也有所減小,因此電路的功耗延時積PDP減小超過37%。即基於亞閾值單元庫的電路性能提升,且功耗大幅度下降,驗證了亞閾值單元庫的完備性和良好的性能,及其低功耗特性。

5 結束語

  基於對0.18μm標準CMOS工藝最小能耗點的研究,以及對亞閾值電壓下NMOS和PMOS電流電壓特性和PMOS的反短溝道效應的研究,提出了溝道寬度調節和PMOS溝長調製結合的尺寸設計策略,根據數字標準單元庫設計流程建立了一套完備的亞閾值數字標準單元庫。亞閾值庫單元的噪聲容限在電源電壓的35%以上,並採用ISCAS基準電路完成單元庫的驗證。0.4 V電壓下,與商用單元庫相比,亞閾值單元庫功耗減小了20%以上,且性能有所改善。驗證了亞閾值標準單元庫單元的穩定性,以及單元庫的低功耗特性。

  參考文獻:

[1]Calhoun B H, Wang A, Chandrakasan A. Modeling and sizing for minimum energy operation in subthreshold circuits[J]. IEEE J. Solid-State Circuits, 2005, 40(9): 1778-1786.

  [2]Qian Xie, Jun Xu, Yuan Taur. Review and critique of analytic models of MOSFET short-channel effects in subthreshold[J]. IEEE Transactions on electron devices, 2012, 59(6): 1569-1579.

  [3]Alioto M. Ultra-Low Power VLSI Circuit Design Demystified and Explained: A Tutorial[J]. IEEE Trans. Circuits Syst. I, Reg. Papers, 2012, 59(1): 3-29.

  [4]Gupta K, Raychowdhury A, Roy K. Digital computation in subthreshold region for ultra-low-power operation: A device-circuit-architecture codesign perspective[J]. Proceedings of the IEEE, 2010, 98(2):160-190.

  [5]Liu Bo, Ashouei M, Standard cell sizing for subthreshold operation[C]. Proceeding of the 49th Design Automation Conference. San Francisco, USA, 2012: 425-128.

  [6]Gibiluka M, Moreira M. A standard cell characterization flow for non-standard voltage supplies[C]. 29th Symposium on Integrated Circuits and Systems Design. Belo Horizonte, Brazil, 2016

  本文來源於《電子產品世界》2018年第11期第38頁,歡迎您寫論文時引用,並註明出處。

相關焦點

  • Open-Silicon採用微捷碼的SiliconSmart ACE進行標準單元和I/O單元...
    加速電路引擎(ACE)通過實現特徵化流程的全面自動化,提供了數量級吞吐量改善     美國加州聖荷塞  2011年8月25日– 晶片設計解決方案供應商微捷碼(Magma)設計自動化有限公司(納斯達克代碼:LAVA)日前宣布,Open-Silicon公司採用SiliconSmart ACE作為標準單元和
  • 無線充電qi協議的主控制器的低功耗設計
    本文主要是對在RTL級電路設計的基礎上進行低功耗設計。1 數字電路功耗的形成電路中的功耗分為兩類:靜態功耗和動態功耗。靜態功耗主要是待機時的功耗,主要由洩露電流組成,一方面是由於MOS管閾值電壓的存在,使得器件在關斷狀態下,具有亞閾值特性,因此會產生亞閾值電流[7]。
  • 北大在碳納米管薄膜電晶體數字電路應用的探索中取得重要進展
    近年來,隨著材料純度和質量的不斷提升,基於隨機取向的碳納米管薄膜電晶體和電路性能也進一步增強,並被嘗試用於高性能數字集成電路,但是這種電晶體在性能和功耗方面能否滿足高性能數字集成電路的標準,尚需從器件物理性質上加以研究。
  • 高精度數字失真度測量儀的設計
    數字方式的失真度分析對硬體的設計要求降低,其性能主要決定於A/D轉換的精度和數位訊號處理算法。僅僅採用FFT來分析失真度是遠遠不夠的,因為測量精度與其運算量、存儲空間的大小和測量速度存在明顯的矛盾。 針對以上失真度測量方法的不足,本文以數字諧波分析法為基礎,提出了基於DFT(離散傅立葉變換)和過零檢測法的失真度分析算法,不僅可滿足高精度和任意頻率的測試需求,還可降低硬體設計複雜度。
  • 數字晶片設計EDA工具的2.0時代(上)
    作為整個IC行業的最前端,數字電路設計關係到後面每一步的狀況。數字前端是在RTL級做的設計。數字電路實際上就是基於邏輯的設計,邏輯上等效的單元,完全可以替換。 工欲善其事,必先利其器。將RTL和根據設計需求編寫的約束文件以及半導體廠商的庫文件作為輸入綜合出門級網表,在性能、面積和功耗之間進行trade-offs。後端布局布線工具將門級網表作為輸入生成GDSII文件用於晶片製造。
  • 數字比較器真值表及電路-電子發燒友網
    用於比較兩個二進位數字的值 數字或二進位比較器由標準 AND 組成, NOR 和 NOT 門,用於比較輸入端子上的數位訊號,並根據這些輸入的條件產生輸出。 例如,除了能夠加和減二進位數之外,我們還需要能夠比較它們並確定輸入 A 的值是否大於,小於或等於輸入 B的值數字比較器使用幾個按照布爾代數的原理工作的邏輯門來實現這一點。有兩種主要類型的數字比較器可用,這些是。 1。
  • 基於FPGA的同步測周期高精度數字頻率計的設計
    摘    要:本文介紹了一種同步測周期計數器的設計,並基於該計數器設計了一個高精度的數字頻率計。文中給出了計數器的VHDL編碼,並對頻率計的FPGA實現進行了仿真驗證,給出了測試結果。
  • 一種汽油發動機感應式數字轉速表設計
    現在,轎車一 般都是電子式轉速表,包括指針式和液晶數字顯示式,表內有數字集成電路,它將點火線圈輸送過來的電壓脈衝經過計算後驅動指針移動或數字顯示。另外還有一種 轉速表是從發電機取出脈衝信號送到轉速表電路解釋後顯示轉速值,不過因受發電機皮帶打滑等因素影響,數值不太精確[1-2]。目前,手持式轉速表應用很 廣,有光電式轉速表、感應式轉速表,還有用RF401等集成電路晶片來實現對汽車發動機轉速的遙測。
  • 基於Multisim數字電子鐘設計
    數字電子鐘是用數字集成電路構成並有數字顯示特點的一種現代計數器,與傳統的機械計時器相比,它具有走時準、顯示直觀、無機械磨損等,因而廣泛應用於車站、碼頭、商店等公共場所。目前,數字電子鐘的設計,主要是採用計數器等集成電路構成,由於所用集成電路多。
  • 應用PLD實現科氏質量流量計的數字部分設計
    本文主要這種新型科氏質量流量計的系統工作原理,數字系統的設計、實現及關鍵技術,並給出了實際應用結果。數字部分系統設計  數字系統實現模塊圖見圖2。控制單元  控制單元為系統的控制核心,控制整個數字部分的時序,使各部分穩定正常工作。其完成的控制主要有:中斷控制與復用、數據存儲中的時分復用、讀寫控制、數據傳輸控制以及產生系統中各晶片的主要使能信號。
  • 宇航級晶片設計的特別之處
    那麼,與消費級晶片相比,這些昂貴的宇航級晶片在設計階段有什麼特別之處呢?(2)加固標準單元工藝庫標準單元工藝庫是數字晶片的基石。如果把數字晶片看做一個建築,標準單元工藝庫就是構成建築的磚塊。標準單元工藝庫包括反相器、與門、寄存器、選擇器、全加器等多種基本單元,每一個標準單元對應著多個不同尺寸(W/L)、不同驅動能力的單元電路,基於這些基本單元即可構成複雜的數字晶片。鑑於數字晶片的超大規模,已經很難通過全定製電路結構的方式來設計,而直接對商用工藝庫進行加固則是設計成本最低的選擇。
  • TFT-OLED像素單元及驅動電路分析
    要真正實現其大規模產業化,必須提高器件的發光效率和穩定性,設計有效的圖像顯示驅動電路。近來,隨著研究的深入,OLED的發光效率和穩定性已達到某些應用的要求,而其專用的驅動電路技術還不是很成熟。目前,所有平板顯示的驅動均採用矩陣驅動方式,由X和Y電極構成的矩陣顯示屏。
  • CIDP製造業數字資源平臺上線
    昨天,國家相關部門在第十三屆文博會新聞出版·媒體融合館(4號館)舉辦了「CIDP 製造業數字資源平臺」評測報告發布會,宣布國內首個智能製造數位化知識服務平臺上線。 「CIDP 製造業數字資源平臺」是國內上線的第一個智能製造數位化知識服務平臺,被譽為「工程師的寶典——中國製造業科技書數位化的典範」,有超過70萬個機械零部件的標準件庫,囊括數控加工領域的新標準、新材料、新工藝、新技術、新產品、新設計的理論與方法。平臺對於每個智造知識都選擇了適合的表現形式,包括文字描述、圖表示意,甚至有的還配有小動畫、小視頻。
  • 詳解模擬和數字MEMS麥克風設計區別
    詳解模擬和數字MEMS麥克風設計區別 秩名 發表於 2014-04-30 11:05:29   模擬和數字麥克風輸出信號在設計中顯然有不同的考慮因素。
  • 基於FPGA的幀內預測編碼器硬體架構設計詳解
    該方法在分析AVS 幀內亮度5 種預測模式的基礎上,將像素預測與模式判決在一個模塊中完成,並且利用各模式預測的相似性,實現運算單元共享和多種模式並行執行,兼顧了處理速度和實現代價。仿真及綜合結果表明該設計能夠完全滿足標清(704×576,30f/s) 數字視頻的實時處理要求。
  • 高精度電壓電流採集管理單元設計
    1 系統設計方案1.1 總體方案  VCMU獨立實現電池組總電壓、總電流檢測、溫度採集(如需)及絕緣檢測,VCMU把測得的數據通過CAN總線發送給系統總處理單元。VCMU原理框圖如圖1所示。  ADS1110與MC9S12G128系列單片機通過I2C接口進行通訊,將採集的電池總電壓測量值傳送給主控單片機。ADS1110與單片機連接方式如圖2所示。
  • STM32四種庫對比:寄存器、標準外設庫、HAL、LL
    2Standard Peripheral Library Standard Peripheral Library:簡寫SPL,也叫標準外設庫。 相信學習過STM32的朋友,對標準外設庫都不陌生,是一組外圍設備的C語言代碼集合。
  • 不同階數的FIR數字濾波器的DSP設計實現
    最優化設計是將所有的採樣值作為變量,在某一優化準則下,通過計算機進行迭代運算得 到的最優結果。其優化準則可以使用均方誤差準則。但實踐證明,應用最大誤差最小化準則 的等波紋迫近法是更為實用的方法,應用他設計時,階數、通帶和阻帶的邊緣以及誤差的加 權函數都可以自由選擇,十分靈活,設計得到的濾波器,其誤差在整個頻率範圍內均勻分布 ,因而可以以最低的階數迫近提出的指標要求。
  • 一種高精度數字傾角測量系統的設計
    以電子傾角器為傳感器而設計的數字傾角測量系統或數字水平儀不僅能滿足自動測量與控制的要求,而且能使測量的精度和速度大大提高。 以往使用電子傾角器作為傳感器而設計的數字水平儀和電子傾角測量系統,沒有考慮環境溫度對測量精度的影響,故無法滿足某些高精度調平和傾斜角測量的需求。為了進行寬工作溫度範圍的高精度測量,必須對電子傾角器進行溫度補償。