DAC大會臺積電首席科學家演講:DTCO技術為晶片密度提高做出主要貢獻

2020-12-04 手機鳳凰網

編 | 心緣

芯東西7月23日消息,對於開發集成電路(IC)和片上系統(SoC)的人來說,DAC大會都是極重要而全面的會議,電子設計自動化(EDA)領域最先進的公司和研究機構匯聚於此,展示他們最前沿的技術或研究項目。

就在本周二,第57屆DAC 2000正式開幕,這也是DAC大會首次在線上虛擬舉辦。會議為期五天,覆蓋有關人工智慧、機器學習、安全性、電子設計和基於雲設計的最新研究與開發。

在開幕式上,臺積電首席科學家、史丹福大學教授黃漢森(Philip Wong)發表主題演講。 黃漢森聚焦在數據分析、機器學習、AI技術趨勢,主要探討GPU和加速器系統。

他提到,半導體技術是經濟增長、保護環境、改善醫療保健和教育的關鍵。世界各國也已經意識到這種對國家安全和能源領導的重要性。

過去50年中,半導體技術的發展類似於在隧道內行走,前面有一道明確清晰的道路,每個人都知道需要做什麼。

現在我們正在接近隧道的盡頭,技術變得很難做,創新和敏銳的眼光對於21世紀社會關鍵技術的持續發展必不可少。

對此,黃漢森教授概述了幾個重要技術方向。

首先,電晶體的數量與峰值吞吐量相關,可通過DTCO技術提升電晶體密度。

其次,邏輯與內存集成,使內存儘可能接近邏輯,並增加邏輯與內存之間的IO數量,最重要的是增加峰值帶寬和內存帶寬。從封裝技術到晶圓級集成等很多技術選擇越來越多地融合。

此外,最佳執行系統分區的新設計工具將變得必不可少,系統分區需要跨管芯執行。

最後,黃漢森教授談到創新的民主化。在應用和系統驅動的世界中,擁有一個促進創新的生態系統非常重要。

芯東西對黃漢森教授的演講進行梳理,以下為核心內容:

21世紀的應用將是以數據為中心的,數據分析和機器學習應用將主導從數據中心到移動和物聯網的數據收集、處理和評估。許多系統將需要動態學習和適應以獲得信息。

在此次演講中,黃漢森教授將重點關注數據分析、機器學習和人工智慧等技術趨勢,這意味著我將把我的注意力和討論集中在像GPU和加速器這樣的系統上。

一、晶片性能峰值與電晶體數量強相關

數據移動是一大關鍵瓶頸,數據移動所造成的能耗是當今需要解決的問題。

上圖顯示了幾個經典深度學習應用工作負載的數據,硬體配置列在底部。可以看到,絕大多數能耗發生在內存訪問中,包括存儲器產生的能耗,和等待片外內存的數據時計算所產生的能耗。

這是個挑戰,也是巨大收穫的機會,如果我們可以專注於開發具有系統性能的技術。

考慮到這一點,我們先看看半導體技術在過去幾十年中為我們提供了什麼,然後對未來做出了一些預測。

迄今為止,2D微縮(2D Scaling)技術一直在推動半導體技術的發展。電晶體、邏輯門、高密度SRAM、標準單元布局密度都在以指數級增長,而規模擴展是技術的驅動力。

但如果回顧歷史,會發現僅用一種方法無法維持某些技術的進步,摩爾定律通過各種創新得以維繫。

起初是Dennard微縮定律,即隨著電晶體尺寸縮小,它們變得更快、更節約能耗。當製程節點進化變慢,我們轉而用應變矽和高k金屬柵極實現等效微縮。

當平面電晶體達到極限時,我們採用了3D電晶體結構並引入了FinFET技術。如今,密度的提高大多來自設計-工藝協同優化(DTCO)技術。

2D微縮技術的革新增加了電晶體密度,從而降低了成本,並帶來了其他系統優勢。我們用實驗說明器件密度的好處。下圖左側是具有器件密度高的晶片;右側是器件密度低的晶片,但其電晶體具有速度、能量和功率效率等高性能。

對於右邊的晶片,即使電晶體本身也具有良好的性能,對整個晶片和整個系統幫助不大。

因為如果沒有密度,可用器件的數量將很少,沒有足夠的內存或緩存,也就不會有多核晶片,因為多核晶片需要更多的電晶體來實現多進程。出於同樣的原因,也不會加速器。

此外,由於該器件彼此相距較遠,所以長導線會使晶片延時變長,它們的能耗也比電晶體彼此靠近的晶片要高得多。

而豐富的數據計算(或以數據為中心的計算) 的出現,為通過平衡靈活性、增益系統吞吐量和能效、進一步優化系統吞吐量創造了機會。

上圖y軸顯示系統吞吐量,x軸顯示可以執行的任務範圍。 CPU可以執行各種任務,並且一直是計算的主體。以數據為中心的計算支持領域特定架構(DSA),如GPU、TPU和類似的加速器,因為它們能夠以大規模並行的方式高速且高能效執行一組特定領域的任務。

黃漢森教授分享了一篇7月ACM新發表論文中定義的現代GPU和加速器用來提高性能效率的四種主要技術。

(1)特定數據:執行內循環功能的專用邏輯可提高性能和效率;

(2)並行性:並行單元利用本地性、局部性,幾乎不會進行全局內存引用;

(3)本地化&優化內存:將關鍵數據結構存儲在許多小型本地內存中,以低成本和低能耗實現很高的內存帶寬;

(4)減少開銷:專用硬體減少了程序解釋的開銷。

所有這些架構都依賴於有大量電晶體以特定方式來獲得性能和能效。例如下圖所示,GPU峰值吞吐量與電晶體數量具有很強的相關性。

今天,我們需要採取自頂向下(top-down)的方法。

設計選擇取決於系統技術選項,需要堅持不懈地進行創新,以使系統達到最佳解決方案。如果中間或底部存在漏洞,那麼無論頂層看起來多麼好,堆棧都會崩塌。

首先,讓我們看一下使用Roofline模型從系統角度評估性能的情況。

Roofline模型提出使用計算強度(Operational Intensity)進行定量分析的方法,將計算量和放存量放到同一張圖上,從而將其峰值性能可視化。理想情況下,峰值吞吐量和內存帶寬的過程應同時提高。

峰值吞吐量是核心數量、核心頻率、每周期操作數的乘積,決定紅線的高度;內存帶寬是總線寬度、總線頻率和數據速率的成績,決定藍線的斜率。

其中,核心頻率、總線頻率受功率密度和散熱設計功耗(TDP)限制,每周期操作數、數據速率取決於手頭任務、架構設計和行業標準。

諸如此類的體系架構技巧有待改進。對於處理器而言,增長關鍵是引入更多並行性來實現峰值吞吐量;對於內存帶寬,總線寬度最有可能增長,因為此類技術已準備就緒。

這些機會也表明我們需要更多的電晶體、更多的存儲器以及電晶體和存儲器之間的更多連接,將它們組合在一起以提高系統吞吐量。

接下來,黃漢森教授將基於伺服器和數據中心GPU與吞吐量和帶寬相關的趨勢來說明這些觀點。

自2007年以來,峰值吞吐量平均每兩年增長1.8倍,其增長主要歸因於核心數量,與晶片上電晶體數量也直接相關。

關鍵的應用重點已從以CPU為主變為以GPU為主,隨著這種變化,半導體器件技術已通過提供更多電晶體找到了性能提升的新領域,並以最終產品應用可接受的成本提供這些電晶體。

當然,我們還需在多個體系架構方面取得進展。要說明的是,沒有任何一個抽象層可以單獨解決所有問題。

電晶體的數量主要由電晶體密度驅動,每兩年增加約1.6倍,而晶片面積增加的貢獻很小。

其中晶片的數字部分以比上圖所示更快的速度增長,因為晶片的模擬和IO等其他部分的增長速度比數字部分慢。

如圖,藍色數據點顯示的電晶體密度,每兩年增長約1.84倍。再過去十年中,電晶體密度持續提高的趨勢沒有改變。

例如,用紅色數據點表示的接觸柵極間距(CPP)與最小金屬間距(MP)的乘積所表示的密度,每兩年僅增長約1.69倍。

為密度提高做出主要貢獻的是DTCO技術,黃漢森教授認為,這種電晶體數量趨勢將持續相當長的一段時間。有些來自持續擴展,有些來自集成,有些來自DTCO。

如圖是DTCO如何提升邏輯密度的示例。從移動、筆記本、臺式機、伺服器、工作站到超級計算機,所有計算系統的電晶體數量與內存量之間的關係都接近1:1,八個數量級以上的相關性非常驚人。

因此,我們將假定內存容量不是限制因素。

接下來再談談內存帶寬。內存帶寬是數據速率、總線頻率、IO數量或總線寬度(以字節為單位)的乘積。總線頻率可以提高帶寬,但以增加功率為代價。

內存峰值帶寬每兩年增長約1.56倍,比邏輯每兩年增長1.8倍的速度慢。因此,內存帶寬不足且限制了系統吞吐量。

二、3D晶片需平衡邏輯與存儲,I/O連接數量成增加帶寬的重要指標

在較早的論文中,David Paterson教授曾提出建議:如果一切都以相同的速度改善,那麼什麼都不會改變。

這又需要在計算內存集成方面進行創新。

計算內存集成有多種方式。如圖是傳統2D系統,作為基線進行比較。該系統通過有限的I/O連接到矽邏輯裸片的印刷電路板上的插座中。

進一步是2.5D系統,其中HBM型DRAM通過矽中介層與矽邏輯晶片連接,並且比2D系統有更多I/O。

再進一步,想像一下將HBM型DRAM堆疊在具有TSV和微型凸塊的矽通孔的矽邏輯管芯上,我們可以得到微米級的連接。在單個3D晶片上,TSV間距可以降至個位數微米級。

通過單片3D集成可以獲得更細的顆粒和更緊密的連通性,這被稱為N3XT系統。其願景是包含多層邏輯和內存層。內存層覆蓋了從高速內存到大容量內存的範圍,高容量存儲器如綠色塊所示,可用3D形式實現高密度。

這是N3XT納米系統的示例。晶片上需要有大量的邏輯電晶體,同時,3D晶片上的邏輯與內存需要保持平衡。因此,同一晶片上需要有多層邏輯和存儲器,這些邏輯存儲層將最終相互領先,並與超高密度細孔相連。

實際上,過去十年,使用各種晶片級和晶圓級技術,與先進封裝相關的垂直互連密度可提高約3-4個數量級。

當今最先進的TSV間距約為5至10微米,使用晶圓對晶片或SoIC技術時,間距約為1微米。

晶圓級、單片集成技術和封裝技術將在未來平穩地融合在一起,單片集成實際上是2.5D和3D封裝的連續體,包括晶片級和晶圓級封裝。重要的是連接數量、連接密度以及運輸數據的能耗,而不是實現這些數據的特定方式。

如圖所示,連接密度花費了7個數量級以上,從今天的晶圓上晶片解決方案到明天的3D集成,至少要獲得3-4個數量級的改進。

總的來看,為了充分描述未來的技術,需要從系統角度看待數據分析和AI等豐富的數據應用,峰值吞吐量和峰值內存帶寬將是兩個關鍵指標 。

上圖是2007年至2019年的GPU類產品,峰值吞吐量和峰值內存帶寬都被提高。通過紅色箭頭可以看到,峰值吞吐量的增長速度快於峰值內存帶寬,即便在相同的邏輯模式下,這也為系統改進創造了機會。

有三個指標將反映未來半導體技術的最重要屬性:邏輯密度(DL),存儲密度(DM),邏輯與存儲之間的互連密度(DC)。

三、晶片設計工具優化將釋放大量硬體創新

在應用和系統驅動的世界中,擁有一個促進創新的生態系統非常重要。

如今,晶片設計是一項非常昂貴的活動,僅有少數幾個最先進的技術公司才能負擔得起。

這致使硬體系統的創新僅限於一小部分工程師,而軟體應用的創新通常來自社會廣泛的領域。

如果設計工具和生態系統能降低進入晶片設計和系統實施的門檻,那麼硬體方面的大量創新將被釋放。

我們將看到應用程式和系統設計的復興。理想情況下,硬體創新將變得像編寫一段軟體代碼一樣容易。

如果有一天,即使是高中生,也可以設計自己的晶片,並以易於編寫軟體的方式演示應用,那麼我們將可以釋放出許多創新來改善社會。

黃漢森教授相信,這個夢想終有一天會實現。

相關焦點

  • 一文看懂臺積電的技術布局
    能獲得這樣的表現,與他們在技術方面的多維布局有莫大的關係。日前,臺積電舉辦了線上技術大會,揭開了公司多項技術布局和未來發展方向。半導體行業觀察特此摘要,以饗讀者。3nm進度及未來電晶體和材料的發展在技術大會上,臺積電資深副總裁,業務開發張曉強首先做了一個演講,介紹了臺積電技術的發展規劃和對半導體技術未來的看法。
  • GTC中國線上大會主題演講:AI 研究的最新進展
    Bill Dally 在 GTC 中國線上大會主題演講中說道,NVIDIA 的研究人員致力於打造速度更快的 AI 晶片,並將其用於具有更高帶寬的系統,從而簡化編程。這種名為「密集波分復用」的技術,有望在僅一毫米大小的晶片上實現 Tb/s 級數據的傳輸,是如今互連密度的十倍以上。
  • 為3nm工藝鋪路:臺積電最強晶片新技術
    隨著這幾年7nm和5nm工藝的相繼投產,新製程工藝為臺積電帶來了可觀的收入,當然他們也投入了非常多的精力與資金去研發新的工藝來保持領先優勢,前兩天台積電為臺南科學工業園的新廠房舉行了竣工儀式,這是他們未來的3nm工廠,預計2022年下半年臺積電3nm工藝就會投產。
  • 臺積電將建造超級計算AI晶片,加速晶片級計算
    臺積電希望擴大其業務領域,並計劃構建其InFO_SoW(晶圓上集成扇出矽)技術,以便將來構建超級計算機級AI處理器。臺積電已經與Cerebras籤訂了建造晶圓級處理器的合同,但該公司也關注更廣闊的市場,並相信晶圓級處理將證明對Cerebras以外的其他客戶有吸引力。該公司表示將在16nm技術上構建這些晶片。首字母縮寫詞湯要了解臺積電在這裡構建的內容,需要解析多個縮寫。
  • 臺積電研發副總裁黃漢森:2050年電晶體能做到0.1納米,氫原子尺度!
    臺積電研發負責人Philip Wong(黃漢森)在Hot chips大會上表示,他展示了臺積電對晶片技術的前瞻,稱到2050年,電晶體將縮小到氫原子尺度,即0.1nm。」 ,他還詳細介紹了其他晶片技術的發展,比如將內存放在處理器的正上方,他預計這將提高性能。
  • 臺積電研發副總裁黃漢森:2050年電晶體將縮小到氫原子尺度,即0.1nm
    臺積電研發負責人Philip Wong(黃漢森)在Hot chips大會上表示,他展示了臺積電對晶片技術的前瞻,稱到2050年,電晶體將縮小到氫原子尺度,即0.1nm。,他還詳細介紹了其他晶片技術的發展,比如將內存放在處理器的正上方,他預計這將提高性能。
  • 深度解讀提高晶片計算的密度電晶體堆疊技術
    打開APP 深度解讀提高晶片計算的密度電晶體堆疊技術 機器之心 發表於 2021-01-06 16:31:20 兩種電晶體一起造
  • 臺積電:摩爾定律還活著,電晶體密度還可更進一步
    臺積電還展示了一個巨大的2500平方米的矽中介層,包括8個HBM內存晶片和兩個大處理器。本文講述了臺積電如何利用多層堆疊的方法來提高晶片性能。臺積電新任全球營銷主管Godfrey Cheng在博客中寫道:摩爾定律與性能無關,而是與電晶體密度有關。
  • 臺積電成功研發2nm晶片!是技術大爆炸,還是營銷騙局?
    據臺灣經濟日報報導7月13日,臺積電已經研發出2nm的晶片,並在晶片表明切入一種立體且三維環繞的GAA技術。晶片外,其他基本上都還是處於不懂技術的媒體放出來的信號。 雖然晶片技術的理論基礎非常複雜,但理解其基本邏輯還是很容易的。 首先,我們要知道,晶片是從微米級別,一路降到納米級別。 最初,晶片製造的核心部件是平面的,你可以理解為重要部件平鋪上去。
  • 臺積電市值反超!英特爾7nm折戟,首席工程師突然離職
    英特爾近期受挫不斷,7nm製程工藝難產,股價應聲而落,首席工程師也宣布離職。截至發稿前,臺積電市值為3471億美元,超越了晶片大佬英特爾。此前還一度飆升至超4100億美元,超越了美國巨頭強生公司和Visa,成為全球第十大市值公司,並推動臺灣基準股指突破了 30 年以來的最高紀錄。
  • 臺積電存儲大將黃漢森閃電離職,轉任顧問兼首席科學家
    詢問臺積電官方表示,黃漢森博士於 2020 年 4 月 1 日起轉任特聘顧問,並擔任臺積公司首席科學家。同時,查詢臺積電官網上關於經營團隊的陣容,黃漢森的名字與照片已經不存在。 張曉強原本是擔任設計暨技術平臺組織副總,負責管理存儲設計方案及類比訊號暨射頻設計方案,從 2018 年開始,正式接下業務開發副總重任。 再者,是原本擔任研發組織Pathfinding處資深處長的曹敏,晉升為為副總。曹敏畢業於上海復旦大學,擁有史丹佛電機博士,而他加入臺積電的時間非常早,在 2002 年就加入。
  • 全球晶片競爭中,他是唯一有原創發言權的華人科學家
    「委員會能找出他這樣在工業界做出世界級、決定性貢獻的華人科學家,真令人佩服!這樣的人在中國,絕無僅有。」精彩內容很多年後,當他在臺積電研發130納米光刻晶片,每小時已經可以做出100多片時,IBM還有人在用X光做250納米工藝,因為技術滯後且無法量產,最後不得不放棄。你們能不能管管他,不要攪局!
  • 臺積電狠甩華為,開始為 1nm 製程做準備
    據報導,臺積電已經開始為1nm晶片做準備。知情人士透露,臺積電目前正在籌集更多資金,以購買更多具有ASML先進工藝的EUV光刻機。在之前的在線活動中,歐洲微電子研究中心IMEC執行長兼總裁Luc Van den hove在一次在線演講中說,與ASML合作,更先進的光刻機取得了進步。Lucvandenhove表示,IMEC的目標是將下一代高解析度EUV光刻技術和高NA EUV光刻技術商業化。隨著以前的光刻機競爭對手退出市場,ASML掌握了全球主要的先進光刻機生產能力。
  • 高通、臺積電、英特爾同臺論「藝」
    11日,中國國際半導體技術大會(CSTIC 2018)如約在上海國際會議中心拉開帷幕。今年CSTIC邀請FinFET發明家、微電子科學家胡正明教授、高通副總裁PR Chidi Chidamabaram、臺積電業務發展副總裁張曉強以及英特爾技術與製造事業部副總裁Zhiyong Ma,就製造工藝、新材料等方面進行大會主題演講。
  • 碧蘿伊首席科學家張嘉恆教授受邀參加第8屆國際離子液體大會
    5月13日,碧蘿伊首席科學家張嘉恆教授受邀參加在「亞洲最大的園林式酒店」北京友誼賓館召開的國際離子液體大會(COIL)。
  • GAA技術給摩爾定律續命,臺積電先進5、4、3、2、1nm晶片工藝製程布局
    臺積電先進5nm、4nm、3nm、2nm、1nm晶片工藝製程持續推進。ycgEETC-電子工程專輯雖然英特爾規劃的7nm工藝比臺積電的5nm工藝電晶體密度還大,但是後年都很難量產,估計要到2023年,那時臺積電更先進的2nm工藝都量產了。
  • 讓臺積電獨吃蘋果的關鍵者,帶著Chiplet技術首度「獻聲」SEMICON
    SEMICON China 2020 的中國國際半導體技術大會 CSTIC 2020,齊聚全球重量級的半導體技術領軍者,分享當前最前沿、最熱門的技術願景。其實,臺積電面臨的技術競爭對手並非聯電,應該說是整個泛 IBM 技術聯盟。當時 IBM 半導體技術強大,很少人敢挑戰,臺積電第一次做出如此 「膽大妄為」 的決定,研發團隊的壓力之大可以想像。
  • 臺積電擬「風險生產」3納米晶片 2022年下半年量產
    1月16日,蘋果晶片代工廠商臺積電高管證實,該公司將按計劃在2021年開始危險生產3納米Apple Silicon晶片,並在2022年下半年全面量產。早在2020年7月份就有報導稱,臺積電接近敲定其3納米晶片生產工藝,現在該公司有望在2021年開始所謂的「風險生產」。
  • 臺積電曝出晶片頂級技術,谷歌傷口撒鹽?
    11月17日,苦苦從9月15日開始的晶片斷供,近2個月堅持的華為做出了一個重要決定——將旗下手機中低端業務榮耀品牌進行出售。但在其後三天,臺積電卻被曝出晶片頂級技術。這一次不是5nm、不是3nm、更不是2nm,而是推動未來3nm晶片工藝發展的3D晶片製程。作為行業內的晶片製造大佬,在華為受到晶片斷供之際,臺積電也在9月15日之前為華為高端晶片趕工,讓華為手機新機Mate40可以擁有一定數量的高端麒麟900和麒麟9000晶片。
  • 全球衝刺3nm晶片:最燒錢的技術戰,100億美元起
    三星首款3nm晶片研發成功,臺積電3nm晶片電晶體密度達2.5億/mm⊃2;,英特爾官宣製程回歸兩年更新周期。▲全球主要晶圓廠製程節點技術路線圖與此同時,作為過去十年晶片製程演進的關鍵功臣,FinFET之父、美國加州大學伯克利分校教授胡正明被授予國際電氣與電子工程學會授予2020年IEEE榮譽勳章。