舌尖上的硬體(2) CPU/GPU晶片製造解析

2020-12-06 中關村在線

1烘焙出來的半導體晶片

  一沙一世界,一樹一菩提,我們這個世界的深邃全部蘊藏於一個個普通的平凡當中。小小的廚房所容納的不僅僅是人們對味道的情感,更有推動整個世界前進的動力。要想理解我們的世界,有的時候只需要細細品味一下我們所喜愛的美食即可。正因為此,我們才規劃了《舌尖上的硬體》這樣一個系列欄目。通過對美食的品味和體會,我們可以更好地理解許多硬體相關的原理、內涵甚至是趣聞,我們所需要為此準備的,其實僅僅是一顆平和的心而已。

  在上一期的《舌尖上的硬體》欄目中,我們第一次接觸到了隱藏在食物背後的其與半導體業界的神奇聯繫。一張小小的披薩餅,竟然可以將移動晶片設計製造過程的各個環節,以及處在這些環節中的不同廠商之間的關係生動的勾勒出來。這讓我們在嘆服披薩美味的神奇徵服力的同時,對這個世界厚重內在聯繫的敬畏又增加了一份。

  好吧,接下來我們要說的話也許您已經猜到了——這張小小的披薩餅中所蘊含的真實,是遠不止僅僅是揭示晶片供應鏈條背後的關係那麼簡單的。


晶圓廠跟披薩店也有聯繫?

  披薩的美味源自樸實搭配中蘊藏的和諧,更源自整個加工過程的細緻規劃與悉心投入。我們曾經說過擁有Fab的半導體供應商是「執掌火的藝術」之人,它的努力是半導體晶片能夠成型並為我們進行服務的基礎,那麼小小的披薩背後,能不能體現出半導體工業最核心的部分——晶片製造過程的內涵呢?


接下來我們將會向您解密披薩,厄……晶片的製造全過程

  在今天的文章裡,您將會看到一幕前所未見的半導體工業圖景。CPU/GPU晶片的製造過程,將會在我們烹製整張披薩餅的過程中自然而然的來到您的面前。下面,就讓我們開始今天的烘焙之旅吧。


 

》現在去顯卡道轉轉《|》看看今日最新文章《

》顯卡精彩美圖匯總《

2最困難的部分——「真正的」半導體工藝

  ● 最困難的部分——「真正的」半導體工藝

  要明白披薩跟CPU/GPU你只整個半導體晶片工業的關係,我們可能首先要面對一點困難的內容——比如說,您知道一顆CPU/GPU的基本製造流程麼?


晶圓生產線(圖片源自ZDNet)

  在不考慮多次摻雜順序、柵極形成於熱處理前還是熱處理後以及CMP(化學機械研磨)等細節性問題的前提下,半導體的製作流程大體上可以被概括為這樣一個鏈條:單晶矽錠生長—wafer切割—覆膠—光刻—清洗—蝕刻—清洗—覆膠—光刻—清洗—多次摻雜—多次沉積—晶片切割—封測。

  半導體製造過程實際上是一個「自下而上」進行的二維單向過程,人們通過蝕刻形成溝道,透過摻雜形成柵極,經由沉積敷設導線,因為每個過程都需要破壞或者改變一部分wafer表面區域的結構,而且這種破壞和改變都是不可逆的如果提前破壞了後續步驟需要加工的區域,整個晶片將無法完成。所以半導體晶片的製造必須而且只能按照設計好的順序,從最底層向上逐級進行這一系列的破壞和改變。這樣的特點,造就了以「覆膠遮蓋—光刻—清洗暴露—區域處理」為核心半導體晶片製造的獨特過程。

簡單的晶片製造工藝流程(Intel提供)

  對晶片的加工起點是從最基本的溝道形成開始的,在長成單晶矽錠並切割好wafer之後,我們首先要在wafer表面敷上一層對特定波長光線非常敏感的溶膠。接下來,我們會用事先標記好需要形成溝道區域位置的掩模作為「底片」對覆膠表面進行特定波長光束的照射,這一過程就是我們所常說的「光刻」,所有被光束照到的溶膠都會發生光化學反應並產生性變,清洗會令其脫落並暴露出需要蝕刻的wafer表面。


光刻過程

  在這些暴露的表面通過蝕刻完成溝槽的侵蝕「開挖」之後,我們需要清洗並去除wafer表面殘存的對非溝道區域起保護作用的溶膠,然後在完成一次「覆膠—光刻—清洗」的過程,只不過這次被暴露出來的位置是需要透過滲透摻雜來形成柵極的區域。接下來,我們會根據不同需求以及不同Fab的特點多次完成注入/擴散摻雜過程,以此來創造出不同的電學特徵區域,也就是形成柵極。

  接下來需要進行的步驟是完成互聯,無論是使用CVD還是PVD手段,在現有的銅互連工藝當中,我們都會在需要敷線的空間中事先預留好空白和保護區域,然後將接觸材料(在銅中毒敏感場合使用的其他金屬材料)以及銅以氣相沉積的形式擴散進區域並沉積形成導線。至此,晶片的製造主體過程大體上就算完成了,在經過切割和封裝測試之後,它就成了我們所熟悉的半導體晶片。


製造完成等待切割的晶片

  當然,這樣的過程並不是一上手就可以成功的。依舊受「自下而上進行且不可逆的二維單向過程」影響,整個半導體工藝過程中的每一個步驟都會對後面的步驟產生影響,這種影響不僅造成了下遊效應這一影響晶片良率的現象,更讓半導體製造變成了一個需要多次學習和經驗積累的過程。這樣的學習過程就是我們通常所說的tape out/retape out,也就是多次流片過程。通過多次流片並觀察和調整工藝細節,最終成型的工藝將會被用來部署在流水線上進行批量化的快速晶片加工,但被調整的部分均屬細節,整體步驟通常依舊會維持我們前面所接觸的這一順序來進行。

3電晶體可不是「管」哦

  ● 電晶體可不是「管」哦

  在看過半導體晶片製造的大體流程之後,我們需要明確幾個容易出「狀況」的地方,這些小問題不僅長期困擾了很多的愛好者,還在認知層面給我們帶來了許多的誤區。想要理解CPU/GPU究竟是怎樣製作出來的,這些小問題需要被首先糾正。

  1、半導體工藝經常會提及「光刻」工藝,但絕大部分「光刻」並不像很多人想像的那樣用硬X射線、強力雷射、中子波束、1096beam或者黑龍波什麼的在晶圓上直接以轟殺的方式挖溝拓渠。除很少一部分直接雷射通孔之外,光刻工藝所「刻」的都不是wafer本身,而是wafer表面的覆膠。它的目的是讓需要形成被加工的晶圓部位「露出來」,以便後續的蝕刻、摻雜、沉積等工藝的開展,並讓不需要被加工的地方繼續為覆膠所保護。


電晶體可不是「管」哦

  2、「電晶體」並不是「管」,更不是用一把小鑷子夾起來再插到wafer表面的。微觀電路中被我們討論的電晶體儘管具有本質上與早期的電晶體完全相同的電學特性,但它早已經不再是矗立在包覆電極的一大坨晶體那樣的尊榮了,實際上我們可以用「特殊電學性能區域」來稱呼平時被我們叫做電晶體的那個東西。如果要對柵極的形象進行描述,它其實就是wafer表面的一小塊凸起或者凹陷,經由在其周圍摻雜而具備了特定的電學特性,再藉由柵極形成控制機制來達成對開關的控制,可以達到「電晶體」相同的功能和作用。

  3、「XXnm工藝」所說的並不是電晶體或者說柵極的尺寸,這裡說的是刻線寬度,亦即光刻過程預設的溝槽的寬度。

  4、晶片並非只有一層,因為需要大量以公裡為單位計的微觀連線,晶片需要在柵極所在的邏輯層之上完成多達6~8層甚至10層的金屬層,這些層被用來以空間的形式完成導線和互聯,這就是我們常說的多層互聯工藝。原則上互聯層空間利用越有效,導線在邏輯層中出現的距離和所需空間也就越少。因此,優化互聯方式或者直接上攻互聯層都有助於晶片面積的減小以及功耗的控制。


多層金屬互聯

  好吧,我們知道整個晶片的製造過程多少有些難以理解。所以我們還是繼續原本就要進行的工作——烤披薩餅吧。在了解了一份美味的披薩從原材料準備到最終出爐瞬間的全過程之後,相信您將會對半導體晶片的製作過程有一個全新的認識。

4製作「wafer」——和面

  ● 製作「wafer」——和面

  要烘焙一張鬆軟可口又濃香滿溢的北美烤盤披薩,最基礎的事自然是製作餅胚了。和面是一個將麵粉變成麵團的過程,從本質上來講,這一過程跟準備wafer是沒多少區別的。


一切的起點——單晶矽錠

  麵粉本來是分散的澱粉/蛋白質分子團所構成的顆粒,通過適度水的作用,麵粉中的蛋白質和澱粉形成了網格狀的長鏈形態,從而促成了麵粉從顆粒向團聚的轉變。光有水是不夠的,麵粉變成麵團還需要施加適當的外力來幫助過程的進行,我們揉面的過程可以讓水更加均勻的進入麵粉,還可以促使長鏈更好的形成網格並增強麵團的彈性。所以揉面是一個細膩而且充滿了藝術的過程,水的多少、揉壓的手法和力道、甚至是醒面和擀制面胚的步驟都需要精心對待。


cookies need love like everthing does

  我們高筋麵粉加混合了乾酵母的溫水來揉面,同時為了讓麵餅更加鬆軟清香,我們還在其中加入了適量的黃油。黃油的加入增加了和面的難度,所以我們用了比平時更多的時間去揉壓、錘搗和醒發,力求讓麵餅達到最佳的狀態。雖然過程費時而且相當消耗體力,但為了可口的美味,這樣的消耗是值得的。活好面之後,我們把它擀製成與烤盤尺寸相仿的大小,並在上面打一些小洞,一塊披薩的面胚就算準備完成了。


可愛的麵團已經搞定,只等擀成麵餅了

  單晶矽的生長也需要經歷一個類似的過程。單晶體生長是一個平衡延展的過程,任何雜質、應力處理不當或者不均勻的熱力學起伏都可能誘發缺陷以及對稱破卻,並導致晶格變形的發生,讓矽晶格從有序對稱延伸轉變成無序或近程有序狀態,進而讓單晶矽變成多晶矽。所以矽被熔融提煉之後,晶胚需要在一個嚴格控制溫度及其他要素的純淨環境中完成冷卻生長過程,一直到單晶收尾都是如此。稍有差池,整個單晶矽錠都可能會報廢。成長完成之後,經過高精度的切削加工,被切成片的單晶矽就成了我們所說的wafer,也就是晶圓。

  Cookies need love like everything does,只有用心去對待,我們才能獲得自己想要的完美的結果,不管是和面還是製作單晶矽都是如此。

5覆膠,光刻——融化的奶酪

  ● 覆膠,光刻——融化的奶酪

  在面胚準備好之後,我們要做的下一步工作就是將番茄醬、奶酪以及其他各色食材碼放在面胚上面,這個混合食材的過程,在形式和意義上都非常接近半導體晶片製造過程中的「覆膠——光刻」過程。


「覆膠——光刻」過程

  以披薩的角度來講,番茄醬抹在最靠近面胚的地方不僅可以為披薩帶來酸甜的底味並為後續的味道混合增加層次,同時還可以防止面胚水份和內部氣體的過快流失,這有利於面胚充分膨脹以及維持鬆軟的口感。同樣的,奶酪的放置同樣由這樣的作用。在水分散失最快的加熱烘焙初期,奶酪的融化並不充分,這種不充分剛好可以覆蓋面胚並阻止水分向上蒸發。這種特性,讓番茄醬和奶酪發揮出了「覆膠」類似的作用。


我們使用的「上層覆膠」——瑞士幹奶酪

  我們在前面的文章中提到過,「覆膠——光刻」過程的操作細節和目的在於暴露需要加工的wafer區域,同時保護不需要加工的區域。因為蝕刻並不具備自主選擇性,必須加以約束才能達到定向加工的目的,所以覆膠之後,我們只需要對需要加工的區域進行照射,接著只剝離因反應而性變的膠體部分並暴露下方的wafer區域,就可以達到為下一步的蝕刻提供「渠道」了。

  覆蓋、保護、為後續步驟提供基礎和前提,甚至都還沒有送進烤箱,披薩就已經表現出了如此多的與半導體晶片加工過程相似的環節和特徵,我們不得不欽佩大自然的神奇——即便看似毫不相干的兩個領域,其內在往往也是受同樣的規律所支配的。

  敷好了番茄醬、奶酪和餡料,還順手完成了「覆膠——光刻」的過程,那麼當我們將披薩送入烤箱之後,是不是就該看到溝槽形成了呢?

6溝槽形成——受熱膨脹的發麵

  ● 溝槽形成——受熱膨脹的發麵

  隨著麵餅被放入烤箱加熱,一系列神奇的變化都將會開始陸續發生,這其中首當其衝的就是發酵麵餅的膨脹。

  發酵工藝是人類利用微生物的成功典範之一,它會在適宜的溫度下吞噬澱粉,利用澱粉酶將澱粉分解為麥芽糖並進一步分解為葡萄糖,然後以無氧呼吸的方式將至消耗並生成酒精和二氧化碳的,數千年來酵母菌都在忠實的完成著讓麵餅變得鬆軟可口的任務。由於我們使用了添加酵母的溫水來和面,酵母菌會在面胚內部釋放了氣體,這些氣體在受到烘焙過程的加熱之後就會膨脹並在面胚中形成一個個的小孔。這些小孔不僅會讓麵餅變得鬆軟,還為後續湯汁的下滲混合提供了場合。


發酵是披薩美味融合的前提

  作為半導體加工工藝的重要步驟,溝槽的形成同面胚中的氣孔有著異曲同工之妙。無論是形成PN結還是用於敷設線路,溝槽在半導體上晶片中都扮演著重要的角色。在經歷了先前的「覆膠——光刻」過程之後,wafer表面已經露出了所有需要形成溝槽的區域,人們接下來所進行的工作,就是利用這些沒有覆膠區域所形成的「溝渠」,通過物理或者化學侵蝕手段來完成這些區域內不同深度的溝槽開挖工作。覆膠的溝渠起到了導向的作用,可以讓侵蝕沿人們規定的方向定向進行,而覆膠本身尤其到了保護待加工的作用。


溝槽對PN結非常重要

  面胚已經膨脹,wafer的表面也已經完成了溝槽的加工,那麼接下來,我們又會遇到些什麼呢?沒錯,無論是披薩還是半導體晶片,這時候都該是時候「摻雜」了。

7摻雜,沉積——湯汁的下滲和餡料混合

  ● 摻雜,沉積——湯汁的下滲和餡料混合

  顧名思義,摻雜就是在原本「純淨」的基體表面及淺表以滲透的形式加入原本沒有的東西。在半導體晶片的製作過程中,摻雜就是通過物理化學手段將歸於矽以外的元素注入到wafer淺表,而對於披薩而言,「摻雜」就是各種食材餡料出湯之後下滲混合的過程。

  隨著烘焙過程的進行,我們敷在餅胚表面的各種餡料都會因受熱和出湯。無論甜椒、洋蔥、培根還是草菇,它們本身獨特的香氣都會伴隨著湯汁從本體裡滲出,我們最終所要收穫的正是這些香氣混合所產生的味道。而讓這些蘊含香氣的湯汁充分混合的場合,就是披薩的「摻雜」過程。


這麼多材料可不是白準備的

  隨著餡料中湯汁的滲出,自然重力讓這些湯汁均勻的下滲到了奶酪和番茄醬所在的位置,而隨著烘焙時間的延長,奶酪已經隨著烘焙熱量的增加而融化的更加充分,可以與下滲至此的湯汁以及下層的番茄醬更好的混合了。與此同時,餅胚的膨脹在此時也在同時進行當中,氣孔形成的空間剛好接納了自上層下滲的混合了番茄醬、奶酪、肉菜以及草菇的濃湯,至此,在被湯汁滲透的面胚中,美味已至。


烘焙的加熱是湯汁滲出的關鍵

  「半導體」本身並不是一個嚴謹的翻譯,實際上我們可以將之理解成「電流只能在特定條件下定向單向流動」的特殊導體。半導體的導電並非像正常金屬導體那樣以電子氣體定向移動的形式來完成,它必須經由矽晶格共價鍵空穴的載流子定向遷移過程來完成,其性能亦由此決定。而摻雜過程的作用,就是通過混入其他元素來改變矽晶格的結構,進而大幅改變局部區域的電學性能。一旦某一區域的電學性能達到了人們的要求,並且形成了以柵極為形式的控制開關,我們就可以將這一區域看做是「電晶體」的存在了。


摻雜形成N結

  同披薩湯汁的下滲一樣,摻雜同樣是一個物質下滲混合的過程。再又一次的覆膠——光刻過程之後,氧、氮、磷、硼等等元素按照人們的需要被帶入到了特定的裸露出來的區域當中,並在不同擴散驅動力的作用下深入到了wafer的表面。元素的滲入改變了被滲入區域包括電阻以及電容量在內的大部分電學性能,讓該區域成了有別於基體的可以為人們所用的半導體結構,再加上沉積形成的柵極,一個「電晶體」就算是完成了。

  我們想要運算能力,於是我們發明了摻雜沉積形成的電晶體,我們想要美味,於是我們找到了各色食材完美混合的方式。努力去拾起更多大自然給予的饋贈,也許就是我們生存至今並仍在不斷發展的原因吧。

8上層互聯——軟糯的餡料

  ● 上層互聯——軟糯的餡料

  湯汁並不是餡料的全部,各種食材獨特的口感也是構成食物本身吸引力的特徵之一。披薩的吸引力除了混合在一起的平和美味之外,還有上層餡料交織在一起的飽滿口感。


烘焙15分鐘之後,該「上層覆膠」了

  由於我們採用了兩種不同的奶酪,其中流動性較差的瑞士幹奶酪會在烘焙15分鐘之後才加入到餡料的最上層,因此隨著烘焙過程的繼續,位於餅胚上層的餡料會與瑞士幹奶酪逐漸混合併形成一個整體。幹奶酪的嚼勁搭配蔬菜、培根和草菇各異的口感,讓我們在品嘗美味的同時體會到了進食的快感,並最終在我們的舌尖形成了披薩豐滿的形象。


晶片中的互聯

  半導體晶片的製造同樣要經歷這樣的過程。無論是CPU還是GPU晶片,布滿電晶體的邏輯層都需要與外部電路進行對應的連接。動輒十數億甚至數十億的電晶體總量顯然是一個非常龐大的數字,將它們連在一起的連線長度也是相當可觀的。要布置這些連線,而且同樣是「自下而上」不可逆的單向布置這些連線,我們需要的是一個複雜的多次沉積過程,通過各種保護和氣體擴散,將金屬元素以PVD(物理氣相沉積)或者CVD(化學氣相沉積)的方式擴散到了特定的區域,並在該區域形成連線,這就是互聯形成的過程。有了互聯,晶片才有了存在的意義和工作的基礎。


第一張餅出爐嘍

  「叮」,隨著烤箱時間轉盤的歸零,一份令人期待的披薩就這麼出爐了。

9tape out和retape out——烤砸了,那就調整

  ● tape out和retape out——烤砸了,那就調整吧

  生活經驗告訴我們,這世界上不可能有永遠一帆風順的事。當外部環境發生變化之後,一些原本順利的事可能會變得不順利,半導體晶片的生產過程會隨著設計、工藝需求以及生產線技術的改變而遇到困難,廚子也會因為灶臺和廚房空間的變化而把菜搞砸。

  厄,好吧……我們承認我們製作的第一張披薩可以說完全失敗了。


別看料足,二號披薩最終失敗了……

  由於家電評測室內的室溫過低,發麵過程進行的相當不順利,酵母菌們一直都在沉沉的睡去,麵餅也始終沒有按照我們的需求充分的膨脹起來。我們的菜單以及上下均溫的烘焙方式都是針對出湯混合的北美烤盤披薩的烹製過程設計的,沒有充分膨脹的麵餅無法吸吮大量滲出的蔬菜湯汁以及融化的奶酪,底盤溫度不足又讓麵餅改變鬆軟的形態,無法隔絕湯汁的下滲,於是我們的第二張披薩成了由大量濃湯浸泡的死面,幾乎變成了一盤魚頭泡餅……

  沒辦法,趕緊修改工藝吧同志們,要不中午飯可就要「泡湯」了。


Retape out前後晶片……誒不對,是披薩對比

  半導體生產的過程同樣經常會出現各種各樣意料之外的不可控問題,披薩烤砸了會變得難吃,晶片工藝搞砸了就要面對良率低下甚至完全無法生產的結局,尤其是晶片試製的初期階段更是如此。光溶膠的反應速率、蝕刻的速度和深度、熱處理的溫度時間、甚至是前後驅室中反應物的配比,各種紛繁複雜的過程彼此之間存在大量的相互關聯和影響,這些影響都需要觀察,收集經驗以及悉心調整,這就是我們所熟悉的流片及工藝調整過程。一款晶片通常會在經歷過多次流片、尋找工藝缺陷並改進之後才能送入流水線中進行批量生產,甚至調整的過程到此也依舊不會停止,它將會伴隨晶片的幾乎整個生產周期。


G80晶片在生產後期已經進化到了A3版本

  既然面胚無法醒發並吸吮和承接湯汁的下滲,那就只有改進工藝一途了。我們去掉了會導致大量的出湯的紫甘藍並加大了番茄醬的用量,在烤盤中均勻塗抹了一層黃油並將下盤烘焙溫度提升到了230度,更少的出湯量減少了麵餅的負擔,更高的溫度和盤底的黃油讓面胚在烘焙之後變得鬆脆。經過這樣的調整,一盤少量湯汁調味,口感酥脆的墨西哥披薩的出爐不僅拯救了「廚子」的名譽,更讓我們的午飯有了著落。循著香味摸過來的試吃群眾們轉眼便捲走了剛出爐的披薩,我們也算沒白忙活。


改進工藝後的第三張披薩

  好了,retape out完成了,試吃檢驗也已完成,可以批量生產了吧?別急,還得「切」呢。

10切割封測——切餅裝盤

  ● 切割封測——切餅裝盤

  與前面的步驟相比,切割封測應該算是一個技術含量相對較低的過程了。在進行上述加工過程的初期,也就是第一步的「覆膠——光刻」時,人們已經已經按照晶片的邊緣尺寸在掩膜上劃分好了區域,後續的所有步驟均以這些區域為單位在整個wafer表面規則的重複著。當所有加工工作完成之後,人們只需要沿劃分區域的邊緣完成線切割,並將晶片的互聯同最終的封裝引腳連接在一起,整顆晶片就算大功告成了。


樂樂自告奮勇親自操刀

  披薩這邊的工作就更簡單了,拿出道具,切塊,裝盤,搞定。


結果很明顯——切割失敗……

  話雖如此,切割和封測也並非是一個可以漫不經心隨意完成的簡單任務。同wafer切片過程一樣,晶片線切割同樣是一個精度極高的機械操作過程,通常都需要由雷射切割來完成。如果切割不當,晶片的邊緣便可能產生缺陷,我們常見的關閉部分單元的「低階產品」,其中有一部分就來源於這一過程。


GF100就是一顆並未完全開放單元的晶片

  至於披薩切割失敗的後果嘛……我們在事業部內部徵集了能夠以細心來完成切割的人選,最終樂樂憑藉對自己刀章天花亂墜的描述贏得了這一榮耀的機會。但當他實際拿起菜刀之後……怎麼說呢,反正從餡料的狀態來看,這似乎「如我們所料」的可以做一個切割失敗的反面教材了。

11廚房便是「世界」

  ● 廚房便是「世界」

  在揮汗如雨了一整天、將家電評測室攪得天翻地覆並讓半層辦公樓都瀰漫了烘焙的味道之後,我們終於完成了四張披薩。期間的過程可謂一波三折,尤其是retape out這個環節完全是意料之外的——說老實話,我真的沒想到在家正常順利的發麵到了家電評測室會因為低溫而失敗,而且也沒有做過墨西哥披薩……但也恰恰正是這樣的「失敗」,為我們送來了一個計劃外卻能更直觀說明tape out/retape out過程的例子,在感嘆「運氣不錯」之餘,我們也平添了一份對大自然本身的敬畏。


檢驗成果的時刻到了


吃貨們表示ZOL牌披薩味道還算令人滿意

  製作wafer,覆膠,光刻,蝕刻,再覆膠,光刻,摻雜,多次沉積,最後晶片切割封測,在親手烤過披薩之後,當我們再次重溫CPU/GPU晶片的生產過程,並將其與披薩的整個烹製過程對應起來時,我們忽然覺得再多的辛苦都是值得的了。


食物藏天下,味道有乾坤

  大自然的恩賜,不僅僅在於它為我們奉獻了食物或者其他讓我們生存下去的物資,這個世界給予我們的最有用的東西其實是蘊藏在事物背後、統治並推動世界運轉而且能夠為我們所發現的規律和本質。食物是我們最容易接受的東西,以它為切入點來展現同樣蘊藏在技術背後的各種本源和真實,不僅能讓這些看似晦澀的過程變得生動和容易理解,還可以讓我們明白許多足以影響我們生活的道理。當我們靜下心來再次審視身邊的美食時,也許我們能發現更多以前未曾注意過的東西。


這麼看起來像蛋糕不?

  在今後的《舌尖上的硬體》系列當中,我們將會繼續保持這樣的視角,以各種美味的組合和製作過程來為您展現不同的顯卡/半導體晶片技術細節,五味的搭配因何而鮮美誘人、圖形處理過程是怎樣的精妙、食物為何會讓我們大快朵頤、晶片的性能究竟由哪些要素決定、這個世界到底蘊藏了多少和諧與調和的藝術,小小廚房中所發生的一切將會成為我們帶您認識電腦世界的載體。最終,我們將會一起探尋、發現並讚美這個世界的本質。如果一路上能夠有您相伴,我們感激不盡。

《舌尖上的硬體》第一期推出後得到了很多資深玩家的認可,所以作者趁熱打鐵推出第二期,讓你繼續品嘗披薩讀爽技術文。本文還是通過披薩製作流程,為您詳細講解一顆GPU的誕生過程,走過路過千萬不要錯過。

相關焦點

  • 超算安裝GPU-based軟體 (以pytorch為例)
    所以如果我的計算依賴的是比較小眾的軟體,那麼我可以把軟體安裝在共享存儲上,在程序運行的時候可以訪問共享存儲調用相關文件運行。這裡就會出問題了,安裝軟體的時候我是在登陸節點訪問存儲節點,一般來說登陸節點無需強算力沒有GPU,但是軟體在安裝過程中會通過獲取當前設備的硬體信息來來決定安裝版本,比如PyTorch,在運行conda install pytorch torchvision torchaudio cudatoolkit=10.2 -c pytorch官方安裝命令的時候,如果本機沒有英偉達
  • 電腦CPU到達物理極限,這是國產晶片追趕的好時機
    這些年我們國內也誕生了大批的科技企業,比如說大批的國產手機品牌崛起並在國際市場上嶄露頭角,聯想電腦也常年佔據著全球PC出貨量第一的位置。可是不少人都能發現,儘管出貨量很高,但是我們國內的企業賺錢實在是太少了,一切的原因都是因為我們在CPU上仍然受制於人,錢都被上遊廠商賺走了。
  • 亞馬遜加持,英偉達A100 GPU將無人匹敵?
    十年過去了,英偉達現在正在為AWS提供硬體,為下一代開創性的創新提供動力,這是相當有歷史意義的。 在今年的MLPerf中,A100在數據中心推斷方面的表現超過cpu達237x。單個NVIDIA DGX A100系統(帶有8個A100 gpu)在某些AI應用上可以提供與近1000臺雙插槽CPU伺服器相同的性能。
  • 硬體與軟體接口如何與CPU交互
    硬體/軟體接口(簡稱為"HSI")是一個術語,用來描述SoC外圍設備的配置和功能,以及它們如何與CPU交互。 從寄存器位到訪問類型、屬性和功能的各種因素的數量,在現代SoC中可能是絕對令人吃驚的。 例如,如果有一個32位地址總線,可以訪問2 ^ 32內存映射寄存器。
  • GPU上的隨機森林:比Apache Spark快2000倍
    在本文中,我們探索了使用Apache Spark在CPU機器集群上實現分布式隨機森林訓練,並將其與使用NVIDIA RAPIDS和Dask的GPU機器集群上的訓練性能進行了比較。雖然GPU計算傳統上是為深度學習應用而保留的,但RAPIDS是一個在GPU上執行數據處理和非深度學習ML工作的庫,與在cpu上執行相比,它可以大大提高性能。
  • 三星獵戶座2100晶片發布,cpu性能超過驍龍888?
    三星的獵戶座2100晶片發布了,這應該是除了驍龍888晶片外,今年安卓最強的手機晶片之一,其實基本上和驍龍888晶片差不多,除了gpu外,一起簡單的看一下吧!其實這個2100和驍龍888其實都是一樣的工藝設計!
  • 基於RTX2060構建TensorFlow-gpu(keras)學習平臺
    一、conda命令1. onda env list 或 conda info -e 查看當前存在哪些虛擬環境2. conda create --name tf36gpu python=3.6 anaconda3. conda remove -n
  • 盤點:GPU加速的神經網絡與JavaScript的交叉
    Gpu.js提供了一種方便的方式來運行GPU上的JavaScript函數。Brain.js是舊的神經網絡庫的延續,並使用Gpu.js硬體加速。Deeplearn.jsDeeplearn.js是這四個中最受歡迎的項目,被描述為「用於機器智能的硬體加速JavaScript庫」。
  • 中科院宣布2nm晶片技術告破,國產晶片終於彎道超車
    在華為事件不斷升級的時候,中科院傳來了讓所有人振奮的好消息,我國自主研發的新型垂直納米環柵電晶體技術,取得突破性進步,它就給中國的晶片製造插上了騰飛的翅膀。通過多年努力,華為在軟體和cpu方面的研究有了巨大的進步,最後還是因為晶片問題處處被制,最尷尬的是隨時可能面臨不能生產自己的技術產品的尷尬境地。此次中科院所宣布的這種新型垂直納米環柵電晶體技術,是目前世界上晶片領域2納米工藝的主要技術候選方式,有了它屬於我們自己的世界級晶片就能得以實現,就是等於我們找到了晶片領域的大油田。
  • CPU、GPU、TPU、NPU等到底是什麼?
    大致上,相對於現在的處理器有7年的領先優勢,寬容度更高,每秒在晶片中可以擠出更多的操作時間,使用更複雜和強大的機器學習模型,將之更快的部署,用戶也會更加迅速地獲得更智能的結果。  所謂NPU, 即神經網絡處理器,用電路模擬人類的神經元和突觸結構。
  • 晶片製造行業的新方向:「自組裝」技術解析
    此前,國外Semiengingeering網站曾發布過一篇工藝和晶片開發費用的文章。文中指出28nm節點的晶片開發成本為5130萬美元;16nm節點則需要1億美元;7nm節點需要2.97億美元;5nm節點,開發晶片的費用將達到5.42億美元;由於3nm還處於最初期的開發階段,所以其開發成本至今還難以確定,3nm的開發費用有可能超過10億美元。
  • 初學者必讀:六大平板主流雙核晶片解析
    但是與英特爾的處理器自家設計,自家製造不同的是,ARM公司並不自己生產處理器,而是把自家先進的處理器設計方案以授權的方式高價賣給了其它具有處理器生產能力的晶片製造商。  Exynos4210 SoC晶片性能解析:
  • 新型「晶片上的大腦」:為可攜式人工智慧系統打造神經網絡硬體
    記憶元件組成類似突觸的硬體系統,模仿自然信息處理、學習和記憶。當他們用這款晶片來運行幾個視覺任務時,晶片可以「記住」存儲的圖像,並重複多次複製它們,這個版本比由非合金元素製造的現有憶阻器更清晰、更乾淨。他們的研究成果於6月8日發表在《自然·納米技術(Nature Nanotechnology)》雜誌上,展示的這款新型憶阻器設計非常有望應用於神經形態器件。這些電子器件基於一種新型電路,這種電路處理信息的方式模仿了大腦架構。
  • CPU、GPU、NPU、TPU、SOC,哪種晶片的技術門檻最高?
    、智慧型手機等)上負責圖像和圖形相關運算的微處理器。TPU:張量處理單元(TPU)是一種穀歌設計的定製化ASIC晶片,專門用於AI機器學習工作。TPU為谷歌的主要產品提供計算支持,包括翻譯、照片、搜索助理和Gmail等。Cloud TPU將TPU作為可擴展的雲計算資源,並為所有在Google Cloud上運行尖端ML模型的開發者與數據科學家提供計算資源。因此TPU並非用在手機上的晶片。
  • 都是晶片,宇航級晶片與麒麟、英特爾晶片有何不同?中美差距幾何
    這不得不提到太空飛行器計算硬體的問題。事實上,包括火箭和宇宙飛船在內的太空飛行器的CPU通常都不是市場上最新的CPU產品。這些定製的CPU從測試到最終啟動可能需要10年以上的時間,因此最終安裝的CPU可能是10年前的產品。
  • TensorFlow2.1正式版上線:最後一次支持Python2,進一步支持TPU
    去年 10 月,谷歌才發布了 TensorFlow 2.0 正式版。時隔三個月後,昨日官方發布了 TensorFlow 2.1,本次版本更新帶了了多項新特性、功能改進和 bug 修復。據悉,TensorFlow 2.1 的 CUDA 版本為 10.1,cuDNN 版本為 7.6。在對作業系統的支持上,Windows 和 Linux 系統的 TensorFlow pip 版本默認支持 GPU。
  • 大師教你如何製作一個簡單的16位CPU
    當需要某種功能時,只需要把實現該功能的一段程序代碼(稱為子程序)加載到通用晶片上,其功能與專用晶片會完全一樣。經過幾天的思考後,霍夫畫出了計算器的新的體系結構圖,其中包含4塊晶片:一塊通用處理器晶片,實現所有的計算和控制功能;一塊可讀寫內存(RAM)晶片,用來存放數據;一塊只讀內存(ROM)晶片,用來存放程序;一塊輸入輸出晶片,實現鍵入數據和操作命令、列印結果等等功能。