亞馬遜加持,英偉達A100 GPU將無人匹敵?

2020-11-30 騰訊網

2020年10月，英偉達A100 在MLPerf基準測試中創下最新記錄，目前已經可以在亞馬遜雲端進行訪問。

亞馬遜網絡服務(AWS)在10年前的NVIDIA M2050中首次啟動了GPU實例。十年過去了，英偉達現在正在為AWS提供硬體，為下一代開創性的創新提供動力，這是相當有歷史意義的。

在今年的MLPerf中，A100在數據中心推斷方面的表現超過cpu達237x。單個NVIDIA DGX A100系統(帶有8個A100 gpu)在某些AI應用上可以提供與近1000臺雙插槽CPU伺服器相同的性能。

英偉達負責加速計算的副總裁伊恩巴克(Ian Buck)在公布基準業績後表示:「每個行業都在尋求更好的方式，應用人工智慧來提供新的服務，並擴大業務，我們正處於一個歷史的轉折點。」

企業可以在AWS的P4d實例中訪問A100。英偉達聲稱，與默認的FP32精度相比，使用該實例訓練機器學習模型的時間減少了3倍，使用TF32則減少了6倍。

每個P4d實例具有8個NVIDIA A100 gpu。如果需要更高的性能，客戶可以使用AWS的EFA一次訪問超過4,000個gpu。

AWS的EC2副總裁Dave Brown表示，

「我們的客戶使用AWS服務構建、培訓和部署機器學習應用程式的速度非常快。與此同時，我們從那些客戶那裡得知，他們想要一種更低成本的方式來訓練他們的大規模機器學習模型。

現在,隨著EC2 UltraClusters P4d實例由NVIDIA的最新A100 gpu和petabit-scale網絡,我們supercomputing-class性能幾乎人人皆可,同時減少的時間訓練機器學習模型3 x,和降低訓練成本60%相比上一代的實例。」

P4d支持400Gbps網絡，利用NVIDIA的NVLink、NVSwitch、NCCL和GPUDirect RDMA等技術，進一步加速深度學習訓練工作負載。

一些來自不同行業的AWS客戶已經開始探索P4d實例如何幫助他們的業務。

GE醫療集團人工智慧部門副總裁兼總經理Karley Yoder評論道:

「我們的醫療成像設備會產生大量數據，這些數據需要我們的數據科學家進行處理。在以前的GPU集群中，訓練複雜的AI模型（如漸進的GANs）進行模擬和查看結果需要花費數天的時間。

使用新的P4d實例將處理時間從幾天減少到幾個小時。我們看到在不同圖像尺寸的訓練模型上有兩到三倍的速度，同時通過增加批量大小實現更好的性能，通過更快的模型開發周期實現更高的生產率。」

舉一個不同行業的例子，豐田的研究部門正在探索P4d如何改進他們在開發自動駕駛汽車和突破性的新機器人方面的現有工作。

豐田研究院(Toyota Research Institute)基礎設施工程技術主管邁克加裡森(Mike Garrison)解釋說:「上一代P3實例幫助我們把訓練機器學習模型的時間從幾天縮短到了幾個小時。」

「我們期待利用P4d實例，因為額外的GPU內存和更有效的浮動格式將允許我們的機器學習團隊以更快的速度訓練更複雜的模型。」

P4d實例目前在美國東部（北維吉尼亞）和美國西部（俄勒岡）地區可用。AWS表示，計劃很快推出進一步的服務。

相關焦點

英偉達楊健:英偉達仿真模擬方法論助力無人駕駛算法開發

在這種大背景下，英偉達將自己在圖形計算時代所積累的優勢複製到自動駕駛技術上，並且於 2019 年正式向客戶開放 DRIVE Constellation 自動駕駛仿真模擬器。那麼，當下無人駕駛在預期功能安全方面的進展如何？英偉達在仿真驗證方面有什麼獨特的見解？
英偉達證實Pascal與Turing兩代GPU將共存!

鑑於圖靈（Turing）發布初期的定價很高，很多人猜測英偉達（Nvidia）並不急於清退上一代 10-系帕斯卡（Pascal）產品。在最近的花旗全球技術大會上，Nvidia 財務長 Colette Kress 證實了兩代 GPU 架構將會共存的消息。
英偉達發布自動駕駛模擬仿真系統可收集無人駕駛數據

據路透社報導，英偉達Nvidia公司發布了一款自動駕駛模擬仿真系統，通過雲計算能力來模擬無人駕駛汽車在行駛過程中所遇到的突發情況，收集相關數據。近日，Uber無人駕駛汽車交通肇事致死案件在業內引了激烈的討論，關於無人駕駛汽車的安全性再次成為人們關注的焦點。
英偉達發布新一代GPU架構用於數據中心,遊戲玩家得再等等

數據中心將成為數據運算的最基本單位，這也是英偉達的新戰略方向，未來也要能夠提供全程端到端的數據中心等級的GPU運算平臺方案。無論以69億美元收購以色列網絡設備商Mellanox，還是收購網絡軟體公司Cumulus，就是英偉達這種思路的體現。
英偉達安培第二代RTX架構GPU搭載了280億個電晶體採用三星8nm工藝

英偉達安培第二代RTX架構GPU搭載了280億個電晶體採用三星8nm工藝來源：IT之家 • 2020-09-02 15:33:11
英偉達八代GPU史上的超級大飛躍較前一代圖靈架構性能提升20倍

近日，英偉達 CEO 黃仁勳正式發布了新一代 GPU 架構 Ampere 安培，這是英偉達推出的第八代 GPU 架構，較前一代 2018 年發布的圖靈架構性能提升高達 20 倍。據悉，英偉達每代顯卡架構均以頂級科學家命名，這一次以法國物理學家安培命名。
永久免費使用谷歌GPU?英偉達可能要發布專用於挖礦的GPU

另一方面，面對免費GPU，英偉達並無畏懼，還有消息傳出，3月份GTC大會該公司會發布一條挖礦專線。訓練模型，無疑是機器學習中最耗費時間和成本最高的部分。在GPU上訓練模型可以將訓練速度提升接近40倍，將2天的訓練時間減少到幾個小時。但是——提升速度通常意味著你要花錢。
AMD將幫助英偉達GPU引入Smart Access Memory功能,同時也會與...

不過現在事情出現了轉機，據TOMSHARDWARE報導，AMD會放開對英特爾CPU和英偉達GPU的兼容性。上周英偉達確認正在努力讓自己的GPU實現與AMD的Smart Access Memory類似的技術，並且可以與英特爾的CPU配合使用，此事我們也曾報導過。英偉達表示，要實現該功能在技術上不存在問題，因為它屬於PCIe規範的一部分。
亞馬遜將在紐約再開一家無人收銀便利店佔地1700平方英尺周二開業

亞馬遜將在紐約再開一家無人收銀便利店佔地1700平方英尺周二開業【TechWeb】6月11日消息，據國外媒體報導，作為全球電商巨頭的亞馬遜也在擴展線下市場，其在去年的1月22日就在華盛頓州的西雅圖開通了旗下首家無人收銀便利店Amazon
英偉達Turing架構Quadro系列GPU國內首次亮相

DoNews8月24日消息（記者程侃如）8月23日，英偉達在第二十七屆北京國際廣播電影電視展覽會上介紹了採用全新Turing架構的全球首款光線追蹤GPU：NVIDIA？ Quadro？ RTX？ GPU，並演示適用於廣電傳媒娛樂領域各類專業工作流程的技術與應用。
自建GPU伺服器:搭建自己的深度學習PC - CIO頻道 - 企業網D1Net...

在本文中，我將逐步向你展示我今年早些時候搭建的深度學習機器，描述在建立這樣一臺機器時你會遇到的一些選擇以及你可能要付出的成本。價格是自2017年12月以來亞馬遜的直接報價。如果你想進一步深探深度學習——無論是對大型數據集進行研究還是參加Kaggle比賽，或者兩者兼而有之，搭建自己的深度學習機器都是非常有意義的。
超算安裝GPU-based軟體 (以pytorch為例)

這裡就會出問題了，安裝軟體的時候我是在登陸節點訪問存儲節點，一般來說登陸節點無需強算力沒有GPU，但是軟體在安裝過程中會通過獲取當前設備的硬體信息來來決定安裝版本，比如PyTorch，在運行conda install pytorch torchvision torchaudio cudatoolkit=10.2 -c pytorch官方安裝命令的時候，如果本機沒有英偉達
Computex 2019:英偉達推出移動端VR-ready Quadro晶片

他們搭載了全新的Quadro RTX 5000, 4000和3000顯卡，這也是英偉達首次把的Quadro系列顯卡用於Max-Q筆記本平臺，而RTX 5000則是第一個搭載了16GB顯存的移動GPU。它們本質上是面向遊戲的GeForce RTX 2080、2070和2060的Max-Q版本的工作站版本。
三星獲得英偉達第二份GPU生產訂單,採用8nm製程

圖片來源：網絡集微網消息，據businesskorea報導，三星的代工業務最近收到了第二份來自英偉達安培GPU的生產訂單。三星在2020年初獲得了英偉達價值1萬億韓元的訂單，並於9月份交付。據悉，三星在京畿道華城的工廠將使用8nm產線為英偉達生產。
英偉達晶片顯卡技術和作業系統技術到底是什麼?

英偉達晶片技術主要包括顯卡技術和作業系統技術。還有nvidia顯示晶片技術、個人計算機顯示晶片技術和人工智慧/深度學習晶片技術。顯卡技術主要包括pc卡、無線網卡、gpu集成顯卡、雷電3、rgb晶片等。作業系統技術包括windows和osx。
如何以最佳的方式利用MultiGPU機器-NVIDIA,英偉達,GPU ——快科技...

英偉達最近發布的 CUDA 4.0 包含了一系列特性，能簡化工作站或計算節點內多 GPU 的使用。愛爾蘭高端計算中心 (ICHEC) phiGEMM 庫利用 CUDA 4.0 特性實現了同時使用多 GPU 和主處理器的矩陣乘法計算。phiGEMM 的性能提升非常顯著，單個 GPU + CPU 的性能與 Linpack HPL 矩陣乘法相等，後者用於評估世界前 500 強超級計算機。
「史上最強」再進一步,英偉達發布科研級 GPU

2020 年 11 月 16 日，今日英偉達發布 A100 80GB GPU，該產品支持英偉達 HGX AI 超級計算平臺，且內存比上一代產品提升一倍，面向研究人員和工程師提供空間速度與性能，助力實現新一輪 AI 和科學技術突破。
蘇姿豐發布RDNA2架構RX 6000系列新顯卡,與英偉達RTX 3000決戰...

新卡在遊戲性能上實現了和英偉達「並駕齊驅」，價格也極具誘惑力最低579美元。顯卡的競爭或許只是晶片大戰的冰山一角，蘇姿豐將帶領AMD和英偉達在更多行業晶片領域上演「終極之戰」。 AMD新卡堪稱性價比之王，遇上老牌霸主能否並駕齊驅？剛剛，AMD 召開了本月最後一次發布會。
英偉達為何想要收購Arm?黃氏定律正取代摩爾定律

你不可能把每個計算過程都砍掉以便GPU可以有效地處理它，但對於那些你可以做到的（包括許多人工智慧應用程式），你可以在消耗同樣電力的情況下，將執行速度提高很多倍。英特爾是摩爾定律的主要推動者，但它不是唯一的推動者。要使其永久化，需要數萬名工程師和全球數百家公司數十億美元的投資。同樣，英偉達也不是唯一一個遵循黃氏定律的公司。
在舊金山新開的亞馬遜無人便利店裡,我「偷」了個能量棒

在舊金山冷水一樣的秋風中，寸土寸金的金融街上，矽星人站在了新開張僅一天的亞馬遜無人便利店門口。而這是亞馬遜繼在自己老家西雅圖和芝加哥之後，成功開設的第六家無人便利店。從小到大遵紀守法的矽星人，今天就打算以身試法，從亞馬遜無人便利店「偷」一個體積最小的、能揣在口袋裡出門的蘋果能量棒！

亞馬遜加持,英偉達A100 GPU將無人匹敵?

相關焦點

英偉達楊健:英偉達仿真模擬方法論助力無人駕駛算法開發

英偉達證實Pascal與Turing兩代GPU將共存!

英偉達發布自動駕駛模擬仿真系統 可收集無人駕駛數據

英偉達發布新一代GPU架構用於數據中心,遊戲玩家得再等等

英偉達安培第二代RTX架構GPU搭載了280億個電晶體 採用三星8nm工藝

英偉達八代GPU史上的超級大飛躍 較前一代圖靈架構性能提升20倍

永久免費使用谷歌GPU?英偉達可能要發布專用於挖礦的GPU

AMD將幫助英偉達GPU引入Smart Access Memory功能,同時也會與...

亞馬遜將在紐約再開一家無人收銀便利店 佔地1700平方英尺周二開業

英偉達Turing架構Quadro系列GPU國內首次亮相

自建GPU伺服器:搭建自己的深度學習PC - CIO頻道 - 企業網D1Net...

超算安裝GPU-based軟體 (以pytorch為例)

Computex 2019:英偉達推出移動端VR-ready Quadro晶片

三星獲得英偉達第二份GPU生產訂單,採用8nm製程

英偉達晶片顯卡技術和作業系統技術到底是什麼?

如何以最佳的方式利用MultiGPU機器-NVIDIA,英偉達,GPU ——快科技...

「史上最強」再進一步,英偉達發布科研級 GPU

蘇姿豐發布RDNA2架構RX 6000系列新顯卡,與英偉達RTX 3000決戰...

英偉達為何想要收購Arm?黃氏定律正取代摩爾定律

在舊金山新開的亞馬遜無人便利店裡,我「偷」了個能量棒

英偉達發布自動駕駛模擬仿真系統可收集無人駕駛數據

英偉達安培第二代RTX架構GPU搭載了280億個電晶體採用三星8nm工藝

英偉達八代GPU史上的超級大飛躍較前一代圖靈架構性能提升20倍

亞馬遜將在紐約再開一家無人收銀便利店佔地1700平方英尺周二開業