能效比GPU高兩個數量級,清華大學研製首款多陣列憶阻器存算一體系統

2020-12-06 愛集微APP

集微網消息,近日,清華大學微電子所、未來晶片技術高精尖創新中心錢鶴、吳華強教授團隊與合作者在《自然》在線發表了研究論文,報導了基於憶阻器陣列晶片卷積網絡的完整硬體實現。

該成果所研發的首款基於多個憶阻器陣列的存算一體系統,在處理卷積神經網絡(CNN)時的能效比圖形處理器晶片(GPU)高兩個數量級,大幅提升了計算設備的算力,成功實現以更小的功耗和更低的硬體成本完成複雜的計算。

基於憶阻器陣列可以實現基於物理定律(歐姆定律和基爾霍夫定律)的並行計算,同時實現存儲與計算一體化,突破傳統架構對算力的限制。

阿里達摩院在2020年1月發布了《2020十大科技趨勢》報告,其中第二大趨勢即為「計算存儲一體化突破AI算力瓶頸」。 報告指出:「數據存儲單元和計算單元融合為一體,能顯著減少數據搬運,極大提高計算並行度和能效。計算存儲一體化在硬體架構方面的革新,將突破AI算力瓶頸」。

清華大學報導指出,當前國際上的相關研究還停留在簡單網絡結構的驗證,或者基於少量器件數據進行的仿真,基於憶阻器陣列的完整硬體實現仍然有很多挑戰。

錢鶴、吳華強教授團隊通過優化材料和器件結構,成功製備出了高性能的憶阻器陣列。為解決器件非理想特性造成的系統識別準確率下降問題,提出一種新型的混合訓練算法,僅需用較少的圖像樣本訓練神經網絡,並通過微調最後一層網絡的部分權重,使存算一體架構在手寫數字集上的識別準確率達到96.19%,與軟體的識別準確率相當。(校對/圖圖)

相關焦點

  • ...研製出全球首款多陣列憶阻器存算一體系統,能效比GPU高兩個數量級
    除了使用不同卷積核對共享輸入執行並行卷積外,憶阻器陣列還複製了多個相同卷積核,以並行處理不同的輸入。相較於當前最優的圖形處理器(GPU),基於憶阻器的 CNN 神經形態系統的能效要高出一個數量級,且實驗證明該系統可擴展至大型網絡,如殘差神經網絡。
  • ...出全球首款多陣列憶阻器存算一體系統,能效比GPU高兩個數量級
    他們提出用高能效比、高性能的均勻憶阻器交叉陣列實現 CNN,該實現共集成了 8個 PE ,每個 PE 包含2048 個單元的憶阻器陣列,以提升並行計算效率。此外,研究者還提出了一種高效的混合訓練方法,以適應設備缺陷,改進整個系統的性能。研究者構建了基於憶阻器的五層 CNN 來執行 MNIST 圖像識別任務,識別準確率超過 96%。
  • ...全球首款基於憶阻器的CNN存算一體晶片,能效高出GPU兩個數量級
    撰文 | 四月2 月 27 日機器之心獲悉,據清華大學新聞網消息,該校微電子所、未來晶片技術高精尖創新中心錢鶴、吳華強教授團隊與合作者成功研發出一款基於多陣列憶阻器存算一體系統,在處理卷積神經網絡(CNN)時能效比前沿的圖形處理器晶片(GPU)高兩個數量級。
  • 清華制人工神經網絡晶片,能效比GPU高兩個數量級
    被認為具有「存算一體」潛力的憶阻器,因而成為類腦計算領域的熱門器件。近日,清華大學微電子所、未來晶片技術高精尖創新中心錢鶴、吳華強團隊與合作者在頂尖學術期刊、英國《自然》雜誌(Nature)在線發表論文,報導了基於憶阻器陣列晶片卷積網絡的完整硬體實現。
  • 清華實現完整硬體CNN,憶阻器陣列效能高過GPU兩個數量級
    該成果所研發的基於多個憶阻器陣列的存算一體系統,在處理卷積神經網絡(CNN)時的能效比圖形處理器晶片(GPU)高兩個數量級,大幅提升了計算設備的算力,成功實現了以更小的功耗和更低的硬體成本完成複雜的計算。
  • 清華造人工神經網絡晶片,憶阻器陣列效能高過GPU兩個數量級
    eYyednc該存算一體系統在辦理卷積神經網絡(CNN)時能效比前沿的圖形辦理器晶片(GPU)高兩個數質級,可以說在一定程度上衝破了「馮諾依曼瓶頸」的限造:大幅提升算力的同時,實現了以更小的功耗和更低的硬體成本完成複雜的計算。
  • 清華用憶阻器制人工神經網絡晶片,能效比GPU高兩個數量級
    被認為具有「存算一體」潛力的憶阻器,因而成為類腦計算領域的熱門器件。近日,清華大學微電子所、未來晶片技術高精尖創新中心錢鶴、吳華強團隊與合作者在頂尖學術期刊、英國《自然》雜誌(Nature)在線發表論文,報導了基於憶阻器陣列晶片卷積網絡的完整硬體實現。
  • 清華類腦晶片再登Nature: 全球首款基於憶阻器的CNN存算一體晶片
    被認為具有「存算一體」潛力的憶阻器,因而成為類腦計算領域的熱門器件,被寄予提高算力,突破技術瓶頸的厚望。撰文 | 四月2 月 27 日機器之心獲悉,據清華大學新聞網消息,該校微電子所、未來晶片技術高精尖創新中心錢鶴、吳華強教授團隊與合作者成功研發出一款基於多陣列憶阻器存算一體系統,在處理卷積神經網絡(CNN)時能效比前沿的圖形處理器晶片(GPU)高兩個數量級。
  • 清華高濱:基於憶阻器的存算一體單晶片算力可能高達1POPs | CCF-G...
    高濱表示:「器件層面,憶阻器可以把馮諾伊曼架構裡的處理、內存、外存都融合在一起,構建存算一體陣列,這也是存算一體最基本的要素。計算的範式層面,存算一體也從布爾邏輯計算變成了基於物理定律的模擬計算,架構變成存算一體架構。」但新的計算系統因為憶阻器的穩定性、計算誤差累積等問題,2018年以前完整的存算一體晶片和系統並沒有突破。
  • 清華大學的存算一體化架構和並行加速方法專利
    清華大學基於多個憶阻器陣列的全硬體完整存算一體系統,能夠高效的運行卷積神經網絡算法,證明了存算一體架構全硬體實現的可行性,對今後AI算力瓶頸的突破有著極大意義。該成果所研發的基於多個憶阻器陣列的存算一體系統,在處理卷積神經網絡時的能效遠高於GPU,大幅提升了計算設備的算力,成功實現了以更小的功耗和更低的硬體成本完成複雜的計算。 隨著以人工智慧為代表的信息技術革命興起,基於各種深度神經網絡的算法可以實現圖像識別與分割、物體探測以及完成對語音和文本的翻譯、生成等處理。
  • 人工智慧的另一方向:基於憶阻器的存算一體技術
    在報告中吳教授介紹到:當思考未來計算的時候,量子計算、光計算是向物理找答案,類腦計算、存算一體是向生物找答案,也就是向大腦找答案。目前吳老師正在晶片上做電子突觸新器件,做存算一體的架構。新器件方面主要研究的是憶阻器,它的特點是可以多比特,同時非易失,即把電去掉可以保持阻值,並且它速度很快。
  • 中國科學家提出基於憶阻器陣列的新型腦機接口
    清華大學研發的基於憶阻器陣列的腦電信號處理系統正在測試中。圖片由清華大學提供新華社北京9月22日電(記者郭穎)腦機接口技術作為信息科學與神經科學等多學科交叉融合的前沿領域,在康復醫學、醫療電子等領域得到了廣泛關注與應用。來自清華大學的科研團隊提出基於憶阻器陣列的新型腦機接口,相關研究成果日前在線發表於《自然·通訊》。
  • 完全使用憶阻器實現CNN,清華大學微電子所新研究登上Nature
    不久之前,來自清華大學和麻薩諸塞大學的研究者在《自然》雜誌上發表文章,提出用高收益、高性能的均勻憶阻器交叉陣列實現 CNN,該實現共集成了 8 個包含 2048 個單元的憶阻器陣列,以提升並行計算效率。此外,研究者還提出了一種高效的混合訓練方法,以適應設備缺陷,改進整個系統的性能。
  • 清華大學錢鶴、吳華強團隊研製出人工樹突器件,實現新型神經網絡
    Dendrites」的研究論文,報導了基於動態憶阻器的人工樹突器件,成功復現了生物樹突對信號的非線性過濾、積分以及對時間信號的處理方式。為了驗證人工樹突的計算功能,研究團隊將所開發的人工樹突器件與導電細絲型突觸器件、Mott相變型胞體器件進行系統集成,構建了包含突觸、樹突、胞體三種基本計算單元的新型神經網絡。實驗結果顯示,由於樹突功能的引入,該網絡在處理具有複雜背景噪聲的街景門牌號(SVHN)數據集時,胞體的動態功耗降低30倍,網絡的準確率提高8%以上,系統評估整體功耗比CPU降低3個數量級。