GPU 是基礎,英偉達黃仁勳「黃氏定律」預測 AI 性能將逐年翻倍

2020-12-17 IT之家

1965 年,時任仙童半導體公司工程師,也是後來英特爾的創始人之一的戈登 · 摩爾(Gordon Moore)提出了摩爾定律(Moore's law),預測集成電路上可以容納的電晶體數目大約每經過 24 個月便會增加一倍。

後來廣為人知的每 18 個月晶片性能將提高一倍的說法是由英特爾 CEO 大衛 · 豪斯(David House)提出。過去的半個多世紀,半導體行業按照摩爾定律發展,並驅動了一系列的科技創新。

有意思的是,在摩爾定律放緩的當下,以全球另一大晶片公司英偉達(NVIDIA)創始黃仁勳(Jensen Huang)名字命名的定律 「黃氏定律 (Huang’s Law)」對 AI 性能的提升作出預測,預測 GPU 將推動 AI 性能實現逐年翻倍。

英偉達 GPU 助推 AI 推理性能每年提升一倍以上

英特爾提出了摩爾定律,也是過去幾十年最成功的晶片公司之一。英偉達作為當下最炙手可熱的 AI 晶片公司之一,提出黃氏定律是否也意味著其將引領未來幾十年晶片行業的發展?

AI 性能將逐年翻倍

受疫情影響,一年一度展示英偉達最新技術、產品和中國合作夥伴成果的 GTC China 改為線上舉行,黃仁勳缺席今年的主題演講,由英偉達首席科學家兼研究院副總裁 Bill Dally 進行分享。Bill Dally 是全球著名的計算機科學家,擁有 120 多項專利,在 2009 年加入英偉達之前,曾任史丹福大學計算機科學系主任。加入英偉達之後,Dally 曾負責英偉達在 AI、光線追蹤和高速互連領域的相關研究。

英偉達首席科學家兼研究院副總裁 Bill Dally

在今天 GTC China 2020 演講中,Dally 稱:「如果我們真想提高計算機性能,黃氏定律就是一項重要指標,且在可預見的未來都將一直適用。」

Dally 用三個項目說明黃氏定律將如何得以實現。首先是為了實現超高能效加速器的 MAGNet 工具。英偉達稱,MAGNet 生成的 AI 推理加速器在模擬測試中,能夠達到每瓦 100 tera ops 的推理能力,比目前的商用晶片高出一個數量級

之所以能夠實現數量級的性能提升,主要是因為 MAGNet 採用了一系列新技術來協調並控制通過設備的信息流,最大限度地減少數據傳輸。數據搬運是 AI 晶片最耗能的環節已經是當今業界的共識,這一研究模型以模組化實現能夠實現靈活擴展。

Dally 帶領的 200 人的研究團隊的另一個研究項目目標是以更快速的光鏈路取代現有系統內的電氣鏈路。Dally 說:「我們可以將連接 GPU 的 NVLink 速度提高一倍,也許還會再翻番,但電信號最終會消耗殆盡。」

這個項目是英偉達與哥倫比亞大學的研究團隊合作,探討如何利用電信供應商在其核心網絡中所採用的技術,通過一條光纖來傳輸數十路信號。據悉,這種名為 「密集波分復用」的技術 , 有望在僅一毫米大小的晶片上實現 Tb/s 級數據的傳輸,是如今互連密度的十倍以上。

搭載 160 多個 GPU 的 NVIDIA DGX 系統模型

Dally 在演講中舉例展示了一個未來將搭載 160 多個 GPU 的 NVIDIA DGX 系統模型。這意味著,利用 「密集波分復用」技術,不僅可以實現更大的吞吐量,光鏈路也有助於打造更為密集的系統。

想要發揮光鏈路的全部潛能,還需要相應的軟體,這也是 Dally 分享的第三個項目——全新編程系統原型 Legate。Legate 將一種新的編程速記融入了加速軟體庫和高級運行時環境 Legion,藉助 Legate,開發者可在任何規模的系統上運行針對單一 GPU 編寫的程序——甚至適用於諸如 Selene 等搭載數千個 GPU 的巨型超級計算機。

Dally 稱 Legate 正在美國國家實驗室接受測試。

MAGNet、以光鏈路取代現有系統內的電氣鏈路以及 Legate 是成功實現黃氏定律的關鍵,但 GPU 的成功才是基礎。因此,GPU 當下的成功以及未來的演進都尤其重要。

GPU 是黃氏定律的基礎

今年 5 月,英偉達發布了面積高達 826 平方毫米,集成了 540 億個電晶體的 7nm 全新安培(Ampere)架構 GPU A100。相比 Volta 架構的 GPU 能夠實現 20 倍的性能提升,並可以同時滿足 AI 訓練和推理的需求。

憑藉更高精度的第三代 Tensor Core 核心,A100 GPU AI 性能相比上一代有明顯提升,我們此前報導,在 7 月的第三個版本 MLPerf Training v0.7 基準測試(Benchmark)結果中,英偉達的 DGX SuperPOD 系統在性能上開創了八個全新裡程碑,共打破 16 項紀錄。

另外,在 10 月出爐的 MLPerf Inference v0.7 結果中,A100 Tensor Core GPU 在雲端推理的基準測試性能是最先進英特爾 CPU 的 237 倍。

更強大的 A100 GPU 迅速被多個大客戶採用,迄今為止,阿里雲、百度智能雲、滴滴雲、騰訊雲等眾多中國雲服務提供商推出搭載了英偉達 A100 的多款雲服務及 GPU 實例,包括圖像識別、語音識別,以及計算流體動力學、計算金融學、分子動力學等快速增長的高性能計算場景。

另外,新華三、浪潮、聯想、寧暢等系統製造商等也選擇了最新發布的 A100 PCIe 版本以及英偉達 A100 80GB GPU,為超大數據中心提供兼具超強性能與靈活的 AI 加速系統。

Dally 在演講中提到:「經過幾代人的努力,NVIDIA 的產品將通過基於物理渲染的路徑追蹤技術,實時生成令人驚豔的圖像,並能夠藉助 AI 構建整個場景。」

與光鏈路取代現有系統內的電氣鏈路需要軟硬體的匹配一樣,英偉達 GPU 軟硬體的結合才能應對更多 AI 應用場景苛刻的挑戰。

Dally 在此次的 GTC China 上首次公開展示了英偉達對話式 AI 框架 Jarvis 與 GauGAN 的組合。GauGAN 利用生成式對抗網絡,只需簡略構圖,就能創建美麗的風景圖。演示中,用戶可通過語音指令,即時生成像照片一樣栩栩如生的畫作。

GPU 是黃氏定律的基礎,而能否實現並延續黃氏定律,僅靠少數的大公司顯然不夠,還需要眾多的合作夥伴激發對 AI 算力的需求和更多創新。

黃氏定律能帶來什麼?

英偉達已經在構建 AI 生態,並在 GTC China 上展示了英偉達初創加速計劃從 100 多家 AI 初創公司中脫穎而出的 12 家公司,這些公司涵蓋會話人工智慧、智慧醫療 / 零售、消費者網際網路 / 行業應用、深度學習應用 / 加速數據科學、自主機器 / IOT / 工業製造、自動駕駛汽車。

智能語音正在改變我們的生活。會話人工智慧的深思維提供的是離線智能語音解決方案,在佔有很少空間的前提下實現智能交互,語音合成和語音識別保證毫秒級響應。深聲科技基於英偉達的產品研發高質量中英文語音合成、聲音定製、聲音克隆等語音 AI 技術。

對於行業應用而言,星雲 Clustar 利用英偉達 GPU 和 DGX 工作站,能夠大幅提升模型預測精確度以及解決方案處理性能,讓傳統行業的 AI 升級成本更低、效率更高。

摩爾定律的成功帶來了新的時代,黃氏定律能否成功仍需時間給我們答案。但這一定律的提出對 AI 性能的提升給出了明確的預測,並且英偉達正在通過硬體、軟體的提升和創新,努力實現黃氏定律,同時借生態的打造想要更深遠的影響 AI 發展。

黃氏定律值得我們期待。

相關焦點

  • AI時代的摩爾定律?黃氏定律預測AI性能將逐年翻倍
    過去的半個多世紀,半導體行業按照摩爾定律發展,並驅動了一系列的科技創新。有意思的是,在摩爾定律放緩的當下,以全球另一大晶片公司英偉達(NVIDIA)創始黃仁勳(Jensen Huang)名字命名的定律「黃氏定律 (Huang’s Law)」對AI性能的提升作出預測,預測GPU將推動AI性能實現逐年翻倍。
  • NVIDIA GTC介紹新進展:「黃氏定律」讓AI性能實現逐年翻倍
    在計算機領域有一個著名的「摩爾定律」,那就是集成電路的電晶體數量每隔18個月至24個月將增加一倍,「摩爾定律」也成為了計算機領域發展的指導方向,然而如今受制於材料等技術發展的限制,「摩爾定律」明顯放緩。
  • 英偉達「黃氏定律」讓未來的AI算力每年能夠提升一倍
    英偉達「黃氏定律」讓未來的AI算力每年能夠提升一倍 李澤南 發表於 2020-12-20 07:30:00 今年的 GTC China 黃仁勳沒有露面,但黃式定律無處不在
  • 摩爾定律即將走到極限,英偉達試圖推動半導體「黃氏定律」
    記者 | 彭新「在摩爾定律失效的當下,如果我們真想提高計算機性能,『黃氏定律』就是一項重要指標,且在可預見的未來都將一直適用。」在近日舉辦的GTC中國峰會上,英偉達首席科學家Bill Dally做出上述發言。
  • 英偉達官方認可「黃氏定律」,摩爾定律會失效嗎?
    英偉達官方認可「黃氏定律」,摩爾定律會失效嗎? 在這一事實的前提下,他們更多的考慮的問題是:摩爾定律失效後,該如何進一步提高處理器的能效?針對這個問題,一些公司已經找到了自己的答案,比如英偉達。 過去幾年來,黃仁勳一直對外表達「摩爾定律已死、新定律正在形成」,尤其是在GPU方面,更是預測每10年GPU性能增長1000倍,這一預測也被戲稱為「黃氏定律」。
  • 直擊NVIDIA GTC20:AI性能翻倍 黃氏定律真香
    從NVIDIA如何打造最強GPU,加速AI性能,說到正在逐步取代摩爾定律的黃氏定律。在短短一年內,GPU AI性能成倍提升,NVIDIA究竟是如何做到的?NVIDIA首席科學家Bill Dally打造最強GPU一切的基礎都是硬體。
  • 英偉達首席科學家解讀「黃氏定律」:替代摩爾定律,定義AI時代?
    以下是他的主題演講精選:關於Ampere架構、A100和黃氏法則的一切所有一切的基礎都是硬體,但硬體本身是不可以解決難題的,需要藉助軟體來集成強大的計算應對複雜的問題。下面這張圖表展示了從2012年的Kepler,一直到今年5月份的Ampere A100,單晶片推理性能提高了317倍。這就是「黃氏法則」——推理性能每年翻一倍。「摩爾定律」之後,就是它來提升計算性能。此表上只有3代製程技術,從Kepler架構28nm,到16nm,再到最近Ampere是7nm。
  • GPU促使人工智慧大發展 英偉達股票年內翻番
    新冠疫情促使人工智慧產業提速發展,而提供基礎技術的晶片設計公司因此受惠。GPU(圖形處理器)製造商英偉達在12月15日表示,GPU性能正從「數年翻一倍」進化至「一年翻數倍」,相關技術提升更刺激人工智慧行業發展,相信當前的產品將為包括病毒藥物研究、直播電商、遠程會議、物聯網、自動駕駛等多個行業帶來「徹底改變」。
  • NVIDIA:摩爾定律已死 黃氏定律當立
    12月15日,NVIDIA GTC 2020中國線上大會上,NVIDIA首席科學家Bill Dally發表主題演講,重點介紹了他的團隊在AI研究方面的進展,特別強調了以NVIDIA創始人兼CEO黃仁勳本人命名的「黃氏定律」(Huang's Law)。
  • 英偉達官方解讀:Volta Tensor Core GPU實現AI性能新裡程碑
    為了滿足這些需求,英偉達設計了 Volta Tensor Core 架構。英偉達和很多其它公司與研究者一直都在開發計算硬體和軟體平臺來解決這一需求。比如,谷歌打造了 TPU(張量處理單元)加速器,能夠給可以運行在 TPU 上的數量有限的神經網絡帶來優良的表現。在這篇博文中,我們將分享英偉達最近的一些進展,這些進展能為 AI 社區帶來極大的 GPU 性能提升。
  • 「英偉達呼吸機」開源:計算機架構大師打造,黃仁勳點讚
    自 2009 年加入英偉達之後,Dally 領導著一個超過 200 名科學家的團隊,專注於 AI、計算機視覺、自動駕駛汽車、機器人技術和圖形等領域。Bill Dally 在 2018 年的 GTC 大會上。「我不希望看到因為大規模疫情而出現呼吸機短缺的情況,」Dally 表示。
  • 7倍AI算力晶片,TensorRT重大更新,英偉達GTC新品全介紹
    機器之心報導參與:李澤南、四月12 月 18 日,在蘇州舉行的英偉達 GTC CHINA 上,黃仁勳發布了自動駕駛晶片 ORIN。ORIN 被認為是一款「系統級晶片」,包含 170 億個電晶體,這款產品或許將為英偉達在 AI 算力上重新佔據領先位置。
  • NVIDIA首席科學家在GTC中國線上大會主題演講中介紹AI研究最新進展
    著名計算機科學家Bill Dally講述他的團隊如何助力AI性能實現逐年翻倍。今天,NVIDIA 首席科學家 Bill Dally 在 GTC 中國線上大會主題演講中說道,NVIDIA 的研究人員致力於打造速度更快的 AI 晶片,並將其用於具有更高帶寬的系統,從而簡化編程。
  • 「她」時代崛起 從頂級AI盛會看科技女性將如何影響世界
    文/福布斯中國12月15日,NVIDIA首席科學家Bill Dally在GTC中國線上大會主題演講中說道,NVIDIA的研究人員致力於打造速度更快的AI晶片,並將其用於具有更高帶寬的系統,從而簡化編程。
  • ...黃仁勳發布大批硬核產品|arm|英偉達|gtc2020|黃仁勳|jetson nano
    在最後,黃仁勳明確了推進Arm平臺的三大重要舉措。策劃&撰寫:韓平今天,英偉達GTC 2020 (GPU技術大會)在線上舉行,英偉達創始人&CEO黃仁勳依然是一身標誌性的黑色皮夾克出現並發表主題演講。
  • 摩爾定律失效 Raja定律和貝爾定律將取而代之
    摩爾定律最初是指半導體晶片電晶體密度每年翻倍,性能也實現翻番;後來修改為每2年電晶體翻倍,性能提升一倍。除了英特爾外,其他半導體公司認為摩爾定律已經完全無法指導晶片發展。MOORE 'S LAW2005年,英特爾提出了Tick-Tock戰略,實際是摩爾定律修改版,英特爾每2年升級一次架構,間隔年份升級製造工藝。
  • 新聞拍一拍#新的摩爾定律:黃氏定律
    導讀: 麒麟 OS 宣布兼容中望 CAD Mozilla 的 WebThings IoT 平臺成為獨立的開源項目 本文字數:664,閱讀時長大約:1分鐘 作者:硬核老王 新的摩爾定律
  • 「3000美元」黃仁勳NIPS現場扔下核彈:迄今為止最強大GPU Titan V...
    英偉達CEO黃仁勳在NIPS現場展示了「迄今為止最強大的PC GPU——TITAN V,售價只有3000美元。「Volta致力於推動高性能計算和人工智慧的極限。我們用新的處理器架構,指令,數字格式,存儲器架構等打破新的局面,」黃仁勳說:「用TITAN V,我們將把Volta送到了世界各地的研究人員和科學家手中。我迫不及待想看到他們的突破性發現。」
  • Arm在數據中心的價值:黃氏定律背後,英偉達打的什麼算盤?
    當然不能就性能、效率,以及其設計就簡單認定,A64FX就一定能夠在HPC領域掀起多大的浪,生態構建也屬於重要的工作。但很顯然,Arm在HPC、數據中心之上發光發熱,至少就技術、性能層面來看,是沒有任何問題的;而且Arm具備了相當的彈性,是x86平臺可能無法給予的;另一方面,Arm在端側正在對x86發起新一輪猛攻,這可能也將有助於Arm在數據中心的生態構建。
  • Bill Dally:NVIDIA助力 AI推理性能每年提升一倍以上
    通信世界網消息(CWW)今天,NVIDIA首席科學家Bill Dally在GTC中國線上大會主題演講中說道,NVIDIA的研究人員致力於打造速度更快的AI晶片,並將其用於具有更高帶寬的系統,從而簡化編程。