谷歌TPU3.0性能提升8倍,但優勢遭微軟、Facebook軟硬「圍攻」

2020-12-13 雷鋒網

谷歌無論是在自動駕駛還是AI領域都具備優勢,2018谷歌I/O大會的重點之一也是AI技術的發展。在Goole I/O 2018上,谷歌執行長Sundar Pichai宣布推出Tensor Processor Unit 3.0,並表示TPU3.0的計算性能相比去年提升了八倍,可達 100PFlops(每秒 1000 萬億次浮點計算)。

谷歌TPU是專門是為機器學習定製的專用晶片(ASIC),也是為谷歌深度學習框架TensorFlow而設計。據悉相比一般的GPU圖形處理器,TPU可以以8位低精度計算節省電晶體,對精度影響很小同時可以大幅降低功耗、加快速度,同時還有脈動陣列設計,優化矩陣乘法與卷積運算,並使用更大的偏上內存,減少對系統內存的依賴。另外,它還第一次使用了液冷散熱,可以更高效地服務數據中心,便於定製硬體方案。

由於谷歌去年已經發布了第二代產品,所以對於今年TPU3.0的發布我們並不感到意外,不過Sundar Pichai並沒有透露關於TPU3.0的更多細節,但可以看到谷歌希望以TPU為基礎讓Google Cloud像Amazon AWS一樣無處不在。

 

微軟Brainwave延遲比TPU低5倍

除了谷歌,其他科技巨頭也在自主研發AI晶片,雖然從公開信息中我們可以了解到Facebook和亞馬遜自主研發晶片還處於早期階段,自主研發定製AI晶片的目的也還不夠清楚,但可以看到的是當數據量越來越大,且擁有最多和最好的數據成為公司重要競爭力的時候,Nvidia的GPU可能不足以處理這些數據,需要超高效的定製晶片。當然,Sundar Pichai還表示,對於通過自主研發定製晶片滿足深度學習需求而言,散熱成為越來越大的難題,這也是谷歌不得不第一次在數據中心使用冷卻液的原因。

所以,不僅科技巨頭的入局,AI晶片的創業公司也開始湧現並獲得資本青睞,像Cerebras Systems、SambaNova Systems和Mythic等初創公司大多數已經籌集了超過3000萬美元,它們希望在具體的應用中通過其研發的AI晶片完成機器學習的任務,並且性價比能超越Nvidia。

當然,有新入局者也有傳統晶片巨頭,英特爾使用FPGA參與AI晶片的競爭,並且隨著機器學習的需求的變化,英特爾設計出更加靈活模塊化的FPGA,但FPGA的成本以及高門檻成為了FPGA應用及推廣中的難度。不過,與谷歌的其他競爭對手也押註定制晶片(ASIC)不同,微軟認為FPGA比ASIC更靈活,並且標準Intel Stratix FPGA的性能至少可以與定製晶片相媲美。因此微軟選擇押寶FPGA,雷鋒網消息,在5月7日開幕的微軟Build2018大會上,微軟CEO  Satya Nadella發布了Project Brainwave預覽版,並稱延遲比TPU低5倍。微軟還稱利用Project Brainwave平臺的客戶可以使用標準的圖像識別模型處理100萬張圖片,單個圖像在1.8毫秒內就能處理,比現在的任何競爭對手的雲服務都要好。

不過,FPGA在雲計算中並沒有被廣泛使用,而微軟正在將FPGA整合到其整個數據中心網絡,成為一種硬體微服務。微軟不可能不了解押寶FPGA面臨的成本以及高門檻高的困難,但由此可見其決心,同時也讓我們看到微軟正在用FPGA參與競爭,這當然是谷歌不可忽略的對手。

PyTorch新版本挑戰TensorFlow

前面已經提到,自主研發晶片只是科技巨頭們為更好處理數據,讓數據產生更大的價值,想要對對開發者產生更大的吸引力還需要配套的工具。因此看到谷歌TPU之上有TensorFlow,Brainwave也支持微軟CNTK和TensorFlow框架。

所以谷歌如果想要把開發人員留住,不僅需要更快的晶片,機器學習的工具也十分重要,讓開發人員進入其GCP(Google Cloud Platform)和其他服務,並使用TensorFlow。這也是谷歌能否從目前核心的廣告業務中逐漸擴展到新的領域並保持領先優勢的關鍵。

但隨著Facebook越來越希望用像PyTorch這樣的框架來挑戰TensorFlow,谷歌想保持領先變得困難。雷鋒網(公眾號:雷鋒網)消息,今年F8開發者大會的第二天,Facebook宣布PyTorch 1.0beta版將在今年夏天和用戶見面,並提前展示了這款新框架的特性。據Facebook介紹,PyTorch 1.0結合了Caffe2和ONNX模塊化、面向生產的特性,也結合了PyTorch靈活、面向研究的特性,為廣泛的AI項目提供從科研原型到生產部署的快速、無縫途徑,讓用戶可以快速實驗,通過能在強制執行模式和聲明執行模式之間無縫切花的混合前端優化性能。

需要了解的是,ONNX(開放神經網絡交換)是Facebook去年聯合多家軟硬體公司發布的神經網絡模型轉換協議,現在新增了對蘋果的Core ML、百度PaddlePaddle、高通SNPE的支持,再加上原本支持的MXNet、Caffe2、PyTorch、TensorFlow、CNTK等框架,實現了神經網絡模型在各種主流框架之間的轉換。

因此,TPU3.0隻是谷歌服務其生態保持領其先地位的第一步,硬體之上的TensorFlow同樣重要。微軟基於FPGA的Brainwave平臺以及Facebook的PyTorch 1.0軟體和硬體都與谷歌形成了競爭關係,未來谷歌能否保持領先地位還需要看其是否能做出快速的回應。

雷鋒網編譯,via techcrunch


現在關注「雷鋒網」微信公眾號(leiphone-sz),回復關鍵詞【2018】,隨機抽送價值 3999 元的參會門票 3 張

相關文章:

Build 大會中的 AI:微軟 AI 雲服務全線更新

Google I/O 2018 : 這裡是所有你不能錯過的大新聞

谷歌AI大一統,Google Research 升級為 Google AI

【評測】谷歌TPU二代來了,英偉達Tesla V100尚能戰否?

雷鋒網原創文章,未經授權禁止轉載。詳情見轉載須知。

相關焦點

  • 微軟AI晶片Brainwave開放雲端試用版 比TPU快5倍
    Project  Brainwave項目在去年8月23日於晶片行業論壇HotChips被微軟提出。微軟表示Project Brainwave計算平臺的目標是:支持快速深度學習運算,並支持開發人員對晶片進行重構。
  • PyTorch終於能用上谷歌雲TPU,推理性能提升4倍,該如何薅羊毛?
    在「 TPU Type」下,選擇TPU類型,為了獲得最佳效果,請選擇v3-8TPU(8個v3)。在「 TPU software version」下,選擇最新的穩定版本。使用默認網絡。設置IP位址範圍,例如10.240.0.0。官方建議初次運行時使用假數據進行訓練,因為fake_data會自動安裝在虛擬機中,並且只需更少的時間和資源。你可以使用conda或Docker進行訓練。
  • 解讀谷歌全面重磅開放的雲TPU
    這款由谷歌去年公開的晶片專門致力於加快AI的計算性能,谷歌利用64塊TPU晶片在短短的半小時內完成了對ResNet-50神經網絡的培訓,這款晶片有助於吸引用戶從亞馬遜AWS和微軟Azure服務轉向谷歌的雲平臺,加快電腦學習計算性能和執行速度,將大力幫助數據科學家利用實驗結果促進未來AI模型的迭代發展。
  • 雙卡性能提升2倍?第三代PCI-E全面揭秘
    雙卡性能提升4倍?  然而PCI-E 2.0對於目前的應用來說還不夠快,桌面PC一般用南橋PCI-E連接外圍設備,數量一般就8條,很多外圍設備如USB3.0晶片、SATA3.0晶片都是通過1條PCI-E 2.0通道連接的,也就是說每向帶寬是500MB/s,比SATA3.0理論帶寬750MB/s和USB3.0理論帶寬600MB/s要低,因此可能會形成瓶頸。
  • 英偉達八代GPU史上的超級大飛躍 較前一代圖靈架構性能提升20倍
    近日,英偉達 CEO 黃仁勳正式發布了新一代 GPU 架構 Ampere 安培,這是英偉達推出的第八代 GPU 架構,較前一代 2018 年發布的圖靈架構性能提升高達 20 倍。據悉,英偉達每代顯卡架構均以頂級科學家命名,這一次以法國物理學家安培命名。
  • 谷歌瀏覽器最強更新,性能飛起,帶來前所未有的瀏覽體驗!
    前幾天換了個純淨版win10系統,微軟edge瀏覽器使用還是不習慣,想安裝谷歌瀏覽器。今天剛更新了谷歌瀏覽器,試用了幾天網頁加載速度明顯變快,性能也大幅度提升,帶來了前所未有的瀏覽體驗。谷歌瀏覽器(chrome) 目前已經推出新的穩定版即Chrome v87正式版,谷歌表示:「由於進行了大量的底層優化,本月發布的更新是近年來 Chrome 性能提升最為明顯的」。新版本正式引入Occlusion Tracking技術,用於優化瀏覽器整體資源調度。
  • 谷歌遭美國司法部起訴 麻煩才剛剛開始?四大科技巨頭或遭強制拆分
    谷歌遭美國司法部起訴,麻煩才剛剛開始?四大科技巨頭或遭強制拆分 摘要 【谷歌遭美國司法部起訴 麻煩才剛剛開始?四大科技巨頭或遭強制拆分】美國司法部當地時間周二正式宣布,將聯合11個州的檢察官,在美國哥倫比亞特區地方法院對谷歌提起民事反壟斷訴訟,以阻止谷歌利用其在搜索和搜索廣告市場上非法獲得的壟斷優勢進行反競爭行為。這是自上世紀90年代美國司法部起訴微軟以來最重大的反壟斷訴訟。此外,未來將有更多的州加入此次司法部的聯合起訴當中。
  • TPU加AutoML:50美元快速訓練高效的ImageNet圖像分類網絡
    谷歌上個月其實已經介紹了這種網絡,詳細內容前查看:進化算法 + AutoML,谷歌提出新型神經網絡架構搜索方法。AmoebaNet在 ICML 2017 大會中展示的論文《Large-Scale Evolution of Image Classifiers》中,谷歌用簡單的構建模塊和常用的初始條件設置了一個進化過程。
  • 谷歌微軟認定WebAPP才是未來
    因而,以谷歌為主的從業者都稱其為PWA(Progressive web apps),意思是漸進式Web APP。在火狐Web開發網站,PWA的優勢是這樣介紹的:PWA是可被發現、易安裝、可連結、獨立於網絡、漸進式、可重用、響應式和安全的。這些應用無處不在、功能豐富,使其具有與原生APP相同的用戶體驗優勢。
  • 重磅| Facebook提出全新CNN機器翻譯:準確度超越谷歌而且還快九倍...
    選自code.facebook作者:Jonas Gehring、Michael Auli、David Grangier、Denis Yarats、Yann N. Dauphin機器之心編譯參與:吳攀、微胖、蔣思源去年穀歌在機器翻譯上取得了連續不斷的突破,谷歌的方法用到了文本處理慣用的循環神經網絡。
  • 彩虹六號圍攻幀數最大化方法 優化電腦性能技巧圖文攻略
    《彩虹六號圍攻》近期很受玩家歡迎,很多玩家想提高遊戲幀數讓遊戲更流暢,如何做呢?下面就為大家帶來彩虹六號圍攻玩家「零ROGEV」分享的最大化幀數及優化電腦性能推薦,一起來看看。    電腦自身性能     或許你有可能因為調度不當 導致遊戲出現幀數低下掉幀 在這裡我可以幫助你最大化你的電腦性能,來運行彩虹六號圍攻    1.推薦你使用最新版本的1709專業版 Windows10
  • 萬字長文看懂阿里、微軟和谷歌的接班人系統
    微軟首先採用了「擁抱策略」,兼容已經擁有「標準定製者及廣泛佔有率」地位的Lotus文件,並推出了功能類似的Excel。Excle和Lotus的軟體高度相似,用戶轉投毫無壓力,同時微軟在易用性上做了顯著的提升;緊接著,微軟開啟了擴展,推出了Office系列,增加了Word和Powerpoint。
  • 智東西晚報:谷歌I/O大會六大產品更新 阿里89元智能音箱開售
    其中Google Assistant升級了更多語音選擇以及視覺AI能力,並且正在內測用人類語言打電話的功能;TPU升級到3.0版本,性能比2.0強大八倍;Android P添加用戶行為學習功能;谷歌新聞使用AI推薦信息流,更像今日頭條了;谷歌地圖同樣添加用戶喜好學習特性,並且將接入Google Assistant。
  • BAIR最新RL算法超越谷歌Dreamer,性能提升2.8倍
    在 DeepMind Control Suite 和 Atari Games 中的複雜任務上,CURL 優於以前的 pixel-based 的方法(包括 model-based 和 model-free),在 100K 交互步驟基準測試中,其性能分別提高了 2.8 倍以及 1.6 倍。
  • TPU薄膜tpu密度與收縮率是多少
    TPU薄膜tpu密度與收縮率是多少 2017-12-04 10:09:05 來源:全球紡織網 TPU薄膜tpu密度是多少?
  • 谷歌加入聊天機器人大戰,臉書、微軟將如何應對?
    谷歌正計劃加入聊天機器人開發業務,並可能在其明天的年度開發者大會上公布一些特點。在微軟的基礎上,谷歌找到了一種方式,使應用開發人員能夠創建在現有的消息應用程式內部運行的程序,如Facebook的Messenger或由谷歌旗下的不太流行的消息應用程式。谷歌即將加入矽谷扣人心弦的「機器人」熱潮。幾個月來就有報導稱,谷歌正在研究一種方式供人們使用其智慧型手機的消息應用與企業或谷歌本身聊天。
  • 從亞馬遜、微軟、谷歌的雲之爭,看國內雲計算的未來
    比如說亞馬遜等在雲計算領域的布局和規模要遠大於國內網際網路廠商,谷歌、微軟等在雲計算領域的布局開始呈現出差異化的態勢。不過,阿里雲在不久前高調喊話亞馬遜,試圖為自己貼上「中美雲計算競爭」的標籤。那麼,亞馬遜、谷歌、微軟等國際網際網路巨頭的雲計算之爭,對國內雲計算市場而言又將有怎樣的啟示?
  • 《帝國時代:圍攻城堡》更新:Xbox/Win 10統一體驗
    在Windows 10中Xbox應用已經成為了連接Xbox One和Windwos 10的遊戲體驗專屬中心,在Win 8.1/WP8/iOS平臺已經推出的戰爭塔防策略類遊戲《帝國時代:圍攻城堡(Age of Empires: Castle Siege)》近日進行了更新,以全新形式登陸了Windows 10 Xbox遊戲平臺,成為繼微軟
  • 微軟認知工具Cognitive Toolkit 2.0 完整版發布!速度是對手的3倍
    Microsoft Cognitive Toolkit 1.0 版本剛推出時,就在速度上秒殺了許多競爭對手。據微軟介紹,2.0版本在前一版本的基礎上強調了可用性,例如添加了對 Python 架構 和 Keras 神經網絡庫的支持。同時,它還進一步強調了未來的擴展性,並在保持1.0版本的速度之上進行了提升。