編者按:北京時間 5 月 11 日 00:00,萬眾矚目的英偉達 CEO 黃仁勳 Keynote 演講,在加州聖何塞舉行。全場長達兩個多小時,本場主題演講的話題涉獵面其實很廣: VR、Volta、超算、GPU 雲服務、自動駕駛晶片、以及機器人訓練。英偉達也恰恰在 GTC 舉辦的同時,公布了2017年第一季度的財報。財務數據顯示,NVIDIA在2017第一季度營收同比增長48%,達到19.4億美元。看來,英偉達已經如同老黃所說,已完全轉型成為領先的 AI 企業。
今年的 NVIDIA GTC 開發者大會,與往年頗有些不同。
北京時間 5 月 11 日 00:00,萬眾矚目的英偉達 CEO 黃仁勳 Keynote 演講,在加州聖何塞舉行。全場長達兩個多小時,雷鋒網記者在媒體中第一位入場,坐在了前排中央。然而,整場演講下來,老黃並沒有一句提到遊戲。
本場主題演講的話題涉獵面其實很廣: VR、Volta、超算、GPU 雲服務、自動駕駛晶片、以及機器人訓練。但是,所有這些話題都有一個共同點:要麼基於 AI、深度學習技術,要麼為 AI、深度學習技術服務。
英偉達也恰恰在 GTC 舉辦的同時,公布了2017年第一季度的財報。財務數據顯示,NVIDIA在2017第一季度營收同比增長48%,達到19.4億美元。在過去一年裡,NVIDIA致力於深度學習的計算系統解決方案極大推動了語音識別、機器視覺、虛擬助手、自動駕駛等領域的發展,而其在各行各業的核心開發者也成為這家「核彈公司」源源不斷的增長動力。
看來,英偉達已經如同老黃所說,已完全轉型成為領先的 AI 企業。本屆 GTC 的主題,便是 AI & 深度學習。當然,還有劃時代的深度學習硬體 Volta。下面,便是本屆 GTC 英偉達發布的五大革命性產品:Project Holodeck、Volta、英偉達 GPU 雲、Xavier DLA,以及 Isaac 機器人模擬機。
Project Holodeck 是老黃髮布的第一個產品,堪稱是本屆 GTC 的開胃菜。它將 VR 和 AI 的頂尖技術相結合,所構建的 VR 社交、工作空間。它有三大特點:
其中最大的亮點,無疑是物理交互體驗。老黃表示,虛擬共享空間必須要遵從物理定律,否則就無從營造真實世界般的沉浸感。相比之下,同屬 VR 社交空間應用的 Facebook Spaces,並沒有這麼強調物理屬性。
英偉達與頂級跑車製造商科尼塞克合作,甚至請科尼塞克創始人 Christian Koenigsegg 利用 VR 化身(上圖中的虛擬人)「現身」說法。
演示中,有兩個細節值得我們注意:
Project Holodeck 將於 9 月開放早鳥體驗。
沒錯,Volta 終於來了。繼 Pascal (帕斯卡)之後的新一代 GPU 架構,在萬眾期待下亮相。對於絕大多數觀眾,不論 GTC 推出了多少 AI 工具,都無法遮掩 Volta 作為本屆大會心臟的事實。
畢竟,英偉達今後二至三年的 GPU 產品線,全都要由 Volta 供血。雖然 Volta 架構的遊戲顯卡最快在今年底才可能與大家見面,但通過深度學習卡,也可一窺 Volta 的滿血性能。那麼在本屆 GTC,英偉達推出了哪些基於 Volta 的產品?
答案是 Tesla V100,以及基於它的深度學習計算機 DGX-1 和 DGX Station。
「迄今為止英偉達難度最高、最複雜的項目;
耗費數千工程師數年光陰來完成;
全世界有史以來最昂貴的計算機項目(研發支出為 30 億美元)。」
說的就是 Tesla V100,基於新一代 Volta 架構。但英偉達在它身上實現的壯舉遠不止與此:
詳細規格見下圖:
相比 Pascal,Volta 有全新的張量運算指令,這就是 Tensor Core。
它既是指令也是數據格式,是 4*4 的矩陣處理陣列。它使得 Volta 的訓練吞吐量達到了 Pascal 的 12 倍,推理吞吐量達到 6 倍。藉助它,Tesla V100 的張量運算能力達到 120 TFLOPS。
它是 Volta 的高性能神經網絡推理引擎,或者說編譯器。目的是為推理運算快速地優化、驗證、部署訓練好的神經網絡。
老黃解釋道:」訓練完成之後,用於訓練神經網絡的框架會生成圖。圖需要為你使用的處理器進行優化、編譯。我們把這稱為 TensorRT。「
眾所周知,深度學習運算可被分為訓練和推理兩部分。從前, N 卡只關注訓練,而在 Tesla V100 上,英偉達終於對推理「動真格」。老黃表示,從 Volta 開始,英偉達 GPU 將對訓練、推理兼顧,可謂是革命性的突破。如圖所示,Tesla V100 的推理運算速度是 Skylake CPU 的十餘倍不止。CPU、FPGA 和 TPU 們怕了麼?
這是 Tesla K80、P100 與 V100 三代架構的性能對比。在 Caffe2、Microsoft Cognitive Toolkit(CNTK)、MXnet 三大框架上,V100 取得了數倍的性能提升。以 Caffe2 為例,訓練時間由 K80 的 40 多小時,縮減到 V100 的不到 10 小時。
深度學習超級計算機 DGX-1 也把 GPU 升級為 Volta,這便是 DGX-1V。
它內置八塊 Tesla V100,運算能力為驚人的 960 Tensor TFLOPS。老黃表示,過去 Titan X 需花費八天訓練的神經網絡,用 DGX-1V 只需八個小時。它相當於是「把 400 個伺服器裝進一個盒子裡」。
售價 149000 美元,即日起接受預定,第三季度出貨。
DGX Station 則是縮小版的 DGX-1V,老黃稱其為「Personal DGX」,堪稱是終極深度學習PC。英偉達內部已經使用很久,每個工程師要麼有 DGX-1V,要麼有 DGX Station,再要麼兩個都有。這次,老黃決心把它推向市場。
它內置四塊 Tesla V100,運算力因而是 DGX-1V 的一半。1500W 功耗,使用水冷。售價 69000 美刀。
另外一個基於 Tesla V100 的新硬體產品是 HGX-1。這是英偉達與微軟合作開發的公有雲伺服器。老黃聲稱,這是業內首個堪稱標杆的雲圖形加速器。它內置八塊 Tesla V100,設計時就考慮了公有雲伺服器必需的多種任務處理與全能性。
「這是世界上首個混合深度學習雲平臺」,老黃說。
每一名深度學習工程師大概都深有體會:在一臺設備上創建、設置開發環境並不是一件省心的事。這花費的時間可能是整整一天,可能是一個星期、一個月,也可能灰心喪氣乾脆放棄。
為解決這一開發者的痛點,英偉達推出了 GPU 雲。它的亮點非常直接——在幾分鐘內設置好本地開發環境。而這,只需要打包下載一整套英偉達優化、整合好的深度學習軟體包。開發者所有需要的庫和框架都包含在內,並且用容器 NVDocker 隔離。
它支持全部深度學習開發框架。當然,為利用雲端成白上千 GPU 的強大計算力,開發者可一鍵在英偉達 GPU 雲設立開發環境,上傳工作進度。
英偉達 GPU 雲 將在七月公測。
Xavier 是英偉達的自動駕駛 AI 處理器。它的創新之處在於,整合了 CPU、GPU 以及 DLA 三大處理器的優點:
雷鋒網註:DLA 即深度學習加速器,前段時間很火的谷歌 TPU,便是 DLA。
Xavier 同時具備 CPU 的單線程性能,CUDA 的並行加速能力,以及 DLA 的計算機視覺特殊功能。
老黃宣布,為加速深度學習技術的普及和進步,將開源 Xavier DLA 供所有開發者使用、修改。初期版本將在 7 月開放,完整版本將於 9 月公開。
Isaac (艾薩克)這個名字,來自於兩個人:一是象徵物理學的艾薩克·牛頓,二是象徵 AI 的艾薩克·阿西莫夫。這是英偉達傾力打造的終極機器人 AI 虛擬訓練環境。
在真實世界人為訓練機器人有先天的局限性:人力成本過高,風險大,耗時長,效率極低。解決的方案,便是在虛擬環境進行機器人訓練。這有點類似於訓練智能體的模擬器 Deepmind Lab 和 OpenAI Gym。事實上,Isaac 直接連通 OpenAI Gym,藉助後者的強化學習功能。
充分利用了英偉達在物理引擎上的造詣,老黃表示,Isaac 的目標是打造一個遵從物理定律的「alternate universe」(替代空間)。虛擬訓練空間將完全遵從現實世界的物理定律,除了時間。理想的情況是,在模擬機中學習過的機器人,就相當於已經預訓練過。
而在時間上,機器人 AI 將以多重「分身」在 Isaac 中進行訓練,每輪訓練中最聰明的那一個,將進入下一輪分配給每個智能體;再從中選出表現最好的那一個進入下一輪,取代上一輪的所有智能體……
如此往復,以訓練出最聰明的機器人 AI。
與GTC第一天的內容集中在圖像處理不同,在兩個小時的演講中裡,只有在開場不久列舉深度學習對圖像處理效果的改善以及中途演示《最終幻想》兩處與圖像處理有關,其他的時間中,老黃大談特談的是AI,是深度學習,是計算能力,是數據中心,是為開發者提供更有效的硬體與平臺。
在2016年,得益於人工智慧紅利,英偉達股價累計漲幅接近200%,成為標普500指數漲幅第一名。而在這次GTC大會上,老黃的演講再一次贏得了資本市場——在演講中,英偉達的股價一直上升,到收盤時漲幅為17.83%,市值達到了720億美元。
如同黃仁勳開場所言:我們需要找到摩爾定律之後的路。在摩爾定律實效、微處理器增速降低到每年10%的今天,GPU 計算的崛起已經在引領著人工智慧的革命。有這樣一組數據可以佐證:在過去5年中,GTC參會者增加了3倍,增長到7000人;GPU開發者增長11倍,增長到超過50萬人......而這一切對於英偉達來說只是一個時代的開始。
關注雷鋒網(公眾號:雷鋒網)微信「leiphone-sz」,回復「0511」,獲得現場完整PPT。
相關文章:
Nvidia推出視頻分析平臺Metropolis,讓你化身未來城市中的「江湖百曉生」 | GTC 2017
Nvidia GTC大會首日現場直擊:立足圖形計算,更多想像 | GTC 2017
Nvidia 發布VRWorks Audio SDK,欲解決VR音效這個大難題 | GTC 2017
科大訊飛:攜手NVIDIA後,應用領域效率提升了50倍 | GTC 2017
GTC大會第二日亮點:NVIDIA將推出多用戶VR系統,計劃培養100000名開發人員 | GTC 2017
雷鋒網原創文章,未經授權禁止轉載。詳情見轉載須知。