AI晶片是個偽概念?淺析AI晶片性能亂象

2020-12-17 EDN電子設計技術

所謂人工智慧,根據1956年達特茅斯會議的定義,就是「讓機器行為看起來就像是人所表現出來的智能行為一樣」。不過雖然這句話理解起來很簡單,想真正實現卻非常困難。在人工智慧的發展過程中,逐漸劃分出兩個發展階段:強人工智慧和弱人工智慧。zClednc

強人工智慧是屬於人類級別的人工智慧,機器擁有思維和意識,可以實現自我推理和自主決策。弱人工智慧則是指機器擅長於處理單一方面的問題,但並沒有真正的思維和意識。由於弱人工智慧發展程度並沒有達到模擬人腦思維的程度,所以弱人工智慧仍然屬於「工具」的範疇,與傳統的「產品」在本質上並無區別。zClednc

目前整個業界所研發的全部人工智慧產品,甚至是Alpha Go,都僅限於弱人工智慧這個階段,許多打著各種幌子的「偽」人工智慧也一併充斥在這片紅海中。與此同時,作為人工智慧的硬體基礎,AI晶片也在短短的一年之內「滿山鮮花開滿坡」。zClednc

向上看,有谷歌TPU和NVIDIA GPU這樣的巨無霸,不是下棋就是開汽車,一個蘿蔔一個坑的佔著幾個攤子。向下看,有各大移動SoC廠商的AI晶片,輸了體積不輸陣,也都是規格明碼標價,性能頭頭是道。zClednc

然而,「你不覺得AI晶片是個偽概念嗎?」這樣的疑問卻從一位AI晶片從業者口中說出,「從半導體圈子的人來看,AI晶片概念比較怪,定義也非常寬泛。你做機器學習也是AI晶片,做深度學習也是AI晶片,做某幾種特定算法也是AI晶片。」zClednc

的確,對於目前這些AI晶片的功能,各家確實都少有明確的描述,基本上都是一句「AI任務」帶過。zClednc

zClednc

不明所以的「AI任務」zClednc

這「AI任務」到底是個啥?一番細看之下,原來大多數所謂的「AI任務」指的都是視頻、音頻、圖像處理這些方面。這些都是非常傳統的需求,而且也都有專用處理器來應對,音視頻處理有DSP,圖像處理有ISP。zClednc

其實無論是視頻音頻還是圖像處理,這些工作都可以在CPU上完成。之所以專門設計DSP和ISP晶片,是因為它們處理這些任務的效率比CPU高出許多。同樣的,如果全新的AI晶片能比傳統DSP和ISP更加高效,那在處理器中加入AI晶片的同時,我們理應看到DSP和ISP從現有晶片組成中消失才對。zClednc

在高通官網的驍龍845介紹中,「可提供更豐富的拍攝、語音、XR 和遊戲體驗」的人工智慧平臺,依然被高通明確的歸結在Hexagon DSP下,說明現在各家AI晶片所宣傳的這些功能,並未達到真正意義上AI所在的層次,只是對既有需求的擴展而已。zClednc


人工智慧平臺依然被高通明確的歸結在Hexagon DSP下zClednc

坊間有過這樣的傳聞,說有一家公司出了款AI晶片,但實際上只是幾顆傳統DSP(數位訊號處理器)晶片的組合,再加上一些軟體層面的修改。zClednc

對於這條傳言的由來,我們無據可考,雖然高通現如今將Hexagon DSP作為支撐AI的基石,看起來這種說法好像也有幾分道理,但也不能排除這只是「同行是冤家」所引起的非議。而且圖靈老爺子於1950年提出的圖靈測試,針對的是一個AI系統的整體表現,對於AI硬體的測試,目前市面上尚沒有專業的通用測試標準。zClednc

不過在前不久,魯大師在其評測軟體中添加了一套AI性能評測,同時支持海思麒麟的HiAI和高通的SNPE框架,也支持在CPU上運行TensorFlow推斷庫。這套AI測試包含了三種不同的神經網絡模型:VGG16,InceptionV3以及ResNet34,輸入的測試數據是ImageNet資料庫中的100張圖片。zClednc


魯大師AI性能評測zClednc

國外知名媒體Anandtech選擇了使用麒麟960的華為Mate 9、使用麒麟970的華為Mate 10 Pro、使用驍龍835的谷歌Pixel 2 XL和LG V30四款手機,分別測試了ARM CPU、Hexagon DSP和NPU的AI性能,測試結果以性能(fps)和效能(mJ/inference)雙重指標來衡量。zClednc

我們首先注意到的一個結果是,NPU和CPU在處理AI運算時的性能有著幾十倍的巨大差異。這些算法在CPU上執行的速度最高不過2fps,同時還會消耗掉大量的電能。無論是驍龍835還是麒麟960的CPU平均功耗都已經超過可持續工作的上限。zClednc

作為對比,驍龍835的Hexagon DSP相比CPU約有8~10倍的性能提升,而麒麟970的NPU性能又可達到Hexagon DSP的1.5倍~4倍。不過在能耗比方面,雖然華為NPU相比CPU有著巨大到已經不在一個次元的優勢,但我們也很驚訝的看到,驍龍835的Hexagon DSP的綜合效率落後麒麟970的NPU僅6%左右。zClednc


Anandtech的測試結果zClednc

雖然魯大師不管在PC和手機端,都素有「娛樂大師」這樣一個不怎麼好聽的綽號,單單這三個測試項也無法代表麒麟970的NPU的全部性能,但我想魯大師應該無意在目前的AI測試中對誰有所偏重,軟體中所選擇的這三個測試項目應該是比較常見且通用的。畢竟現階段的安卓陣營裡,宣稱有AI加速能力的也就只有驍龍835/845和華為麒麟970而已。zClednc

我們知道,AI晶片在美國要經過嚴苛的NSF認證:「要讓DNN(深度神經網絡算法)計算功耗比提升1000倍的晶片」,這也許是高通依然將人工智慧平臺歸結在Hexagon DSP下的原因之一吧。zClednc


瑞芯微自曝的RK3399Pro成績頗為驚人zClednc

我在之前的文章裡也曾經說過,目前絕大部分AI晶片,都是廠商對AI大潮反應過激的產物,好像如果名字裡沒有AI,都不好意思在江湖上報號。那個坊間傳聞,雖然並沒有任何實錘,但也許真的是目前AI晶片領域現狀的映射。zClednc

想要在量子計算時代到來前,在傳統半導體工業中實現真正的強人工智慧,除了要進行大刀闊斧的晶片架構研發,還要引進新的電子元器件——憶阻。其實這東西說新也不新,憶阻是除電阻、電容、電感之外的第四大電路元件,早在 1971 年,任教於美國的柏克萊大學的華裔科學家蔡少棠便提出了憶阻器的概念。zClednc

現行的計算機體系中最常見的是「馮•諾依曼架構」,即計算機由存儲器、控制器、運算器、輸入輸出四部分組成,這和人腦的結構有著巨大的差別。人腦的存儲、控制和運算三位一體,而憶阻可以讓半導體電路具有和人腦一樣的「三位一體」特性。zClednc


四大電路元件,憶阻在右下角zClednc

可以說,如果沒有憶阻,僅靠傳統的三大電路元件,任何模仿人腦模式的人工智慧,在運算效率上都只能是事倍功半,除非人類能夠研發出一條與人腦完全不同的智能模式。zClednc

雖然AI晶片不可能僅靠一個憶阻便一朝功成,但更不是像如今這樣在名字裡貼上AI兩個字母就可以齊活兒的。那些以AI為名的晶片廠家,只有極少數廠家在有目的有方向的進行研發,其餘大多都是浮躁。zClednc

圖靈曾預測,人工智慧的思考能力在2000年時可達到這項測試的標準。這項測試至今依舊被視為衡量人工智慧發展水平的準繩,但目前卻仍沒有出現在哪家公司的roadmap中,我們達到圖靈測試的標準還遙遙無期。zClednc

路還很長,不知道這樣混沌的發展狀況,還要持續多長時間?zClednc

(來源:青亭網)zClednc

zClednc

相關焦點

  • AI強攻EDA,無人晶片設計還有多遠?
    新思科技推出了自主人工智慧應用程式——DSO.ai(Design Space Optimization AI),DSO.ai能夠在晶片設計的巨大求解空間裡搜索優化目標。通過對晶片設計流程選項的探索,能夠自主執行次要決策,而晶片設計工程師可以進行更高階的操作,從而提升整體的生產力。
  • 谷歌新研究:AI可以在6小時內設計出計算機晶片
    他們聲稱,該方法完成晶片設計的平均時間不到6個小時,這比人類專家花數周時間完成設計要快得多。晶片布局規劃困局在傳統的 「布局布線」 任務中,晶片設計人員使用軟體來確定晶片電路在晶片中的布局,類似於設計建築物的平面圖。
  • 2020年最值得關注的10家國外AI晶片初創公司
    AI晶片之戰正在英特爾和Nvidia等半導體巨頭之間進行,許多較小的公司也押注參與競爭。到目前為止,Nvidia的GPU一直處於專用AI晶片競賽的領導地位,但是一些AI晶片初創公司相信,其產品無論是在成本、效率、性能還是在深度學習工作負載的靈活性方面,它們都可以超越晶片巨頭。
  • 為增強AI晶片實力,英特爾又收購了一個7個人的初創公司Vertex.ai
    雷鋒網消息,為了進一步增強在人工智慧領域的競爭力,英特爾又收購了一家AI初創公司Vertex.ai,不過交易的金額並未透露,但英特爾確認了此項交易,整個團隊包括創始人都將加入英特爾的人工智慧產品事業部。
  • 英特爾新發布Myriad X超強視覺處理AI晶片
    【AI星球(微信ID:ai_xingqiu) 】9月8日報導 (編譯:小白)當英特爾的Movidius團隊發布Myriad 2視覺處理器(VPU)時,其被認為是令人稱奇的技術和設計。
  • AI晶片0.5版本」的現狀和前景,對未來的「AI晶片2.0」的思考與展望
    這是一篇關於AI晶片的總結與回顧,作者以ISSCC2019上AI晶片相關內容為主體,分析了「AI晶片0.5版本」的現狀和前景,並提到了Yann LeCun對未來的「AI晶片2.0」的思考與展望。 我從2017年的ISSCC開始寫AI硬體相關的文章,到現在剛好兩年了。
  • 36氪首發|針對稀疏化神經網絡開發高算力AI晶片,「Moffett AI」獲...
    Moffett AI目前擁有高算力的FPGA產品,並將用這筆資金持續研發高算力的雲端AI晶片。伴隨著AI深度學習的不斷發展以及各類算法的推進,AI晶片作為提供算力的平臺,GPU正在向更優化的數據流架構方向轉變。
  • 華為榮耀v30亮相,搭載麒麟990晶片,性能優越
    今天我們所要聊的話題是華為榮耀v30亮相,搭載麒麟990晶片,性能優越。據統計截止到9月底華為的市場份額已經超出了41%成為國內手機市場的龍頭老大,但是華為並不滿足現狀,將要推出榮耀系列v30,這款手機性能優越,顏值高一起來跟小秋看一下吧。
  • 5款晶片已經面世,可重構架構是AI晶片的新風潮?
    可重構的概念最早在20世紀60年代被提出。到了80、90年代,可重構晶片技術源頭的高層次綜合理論和方法誕生。進入新的世紀,2015年國際半導體技術發展路線圖(ITRS)認為,粗顆粒度可重構架構(CGRA)是未來最有發展前途的新興計算架構之一。
  • 零基礎看懂全球AI晶片,詳解xPU
    獻給:對AI晶片行業有興趣、想快速了解相關公司和產品的各種讀者。不限晶片工程師。致敬:向所有AI晶片領域的初創公司致敬,為你們免費打廣告;向共同奮鬥在AI晶片start-up的晶片工程師致敬,和你們一起前行。隨著AI概念火爆全球,做AI晶片的公司也層出不窮。
  • 蘋果A系列晶片的三年AI進化
    根據蘋果的介紹,A14 Bionic處理器是蘋果首款採用5nm工藝打造行動裝置晶片,電晶體數量相較於A13 Bionic處理器的7nm晶片增加了近40%,電晶體數量達到了驚人的118億顆。僅憑工藝製程的提升,A14在性能和功耗表現上自然會有一定的提升。官方宣稱,在性能比較上,CPU提升40%,全新GPU構架提升30%。
  • 公開課二十一期筆記:睿思芯科如何基於RISC-V架構打造AI晶片
    點這裡觀看回放在晶片領域不得不提CPU,它是晶片技術的集大成者。CPU是晶片領域集中度最高,代表晶片行業發展最先進的技術領域。而在CPU執行計算任務前,軟體程序都需要先翻譯為CPU可以理解並執行的語言,而這種語言就是指令集。
  • 看懂未來十年AI晶片趨勢!GTIC 2020 AI晶片創新峰會成功舉行
    2、AI晶片從算法和應用角度給行業提出了許多創新需求,促使人們探索更多的顛覆性技術,有望徹底突破傳統架構的性能和能效瓶頸,實現集成電路的跨越式發展。在張亞林看來,AI系統要落地數據中心必須具備四個要素,分別為系統集群、板卡、高性能高算力的晶片,以及全棧的軟體。而衡量一個數據中心的AI系統需要從完備性、生產率、成本、功耗和性能五個維度來考量。「當下雲端AI晶片產品化面臨著系統化、工程化、產品化、生態化四大挑戰。
  • 晶片巨頭們2019年的AI晶片之爭會如何?
    不過,隨著晶片巨頭在AI晶片領域有了新的進展,NVIDIA將會面臨更多的挑戰,2019年AI晶片市場會如何?作者將會分三部分進行介紹,本文是第一部分。去年,NVIDIA和 IBM為世界上最快的超級計算機提供晶片(據稱其中95%的性能歸功於NVIDIA的Volta GPU)。雖然這是一項令人難以置信的成就,但許多人開始懷疑NVIDIA的輝煌能否持續。
  • 英偉達官方解讀:Volta Tensor Core GPU實現AI性能新裡程碑
    在這篇博文中,我們將分享英偉達最近的一些進展,這些進展能為 AI 社區帶來極大的 GPU 性能提升。採用這些改進,我們已經在單塊晶片和單個伺服器上實現了創紀錄的 ResNet-50 性能表現。一個 Cloud TPU 中的 4 塊 TPU 晶片能提供 180 TFLOPS 的性能;相比而言,4 塊 V100 晶片能提供 500 TFLOPS 的性能。我們的 CUDA 平臺讓每一種深度學習框架都能充分利用我們的 Tensor Core GPU 的全部力量來加速正在快速增多的各種神經網絡類型,比如 CNN、RNN、GAN、RL 以及每年湧現的數以千計的變體。
  • AI晶片免費能成為AI大規模產業化的鑰匙嗎?
    我記得之前有一個併購的案例,91助手和展訊兩家公司幾乎同時被併購,但是它們價值的差異十分巨大,這讓我們這幫做晶片的工程師感到比較心寒。這從一個側面也反映了一些問題,作為工程師要看自身的價值體現在哪裡,在人工智慧時代,會比在網際網路時代可能有數量級的差異。但是晶片又是不可或缺的,最近的中興通訊事件更加說明了晶片的重要性。「舉個例子,我們用水、電感覺不到,但是缺了水龍頭和插座會感覺不到嗎?
  • 基因晶片概念 基因晶片概念解析
    基因晶片概念解析  基因晶片(又稱DNA晶片、生物晶片)的原型是80年代中期提出的。基因晶片的測序原理是雜交測序方法,即通過與一組已知序列的核酸探針雜交進行核酸序列測定的方法,在一塊基片表面固定了序列已知的靶核苷酸的探針。
  • 一文看全:全球99家AI晶片公司全景圖,中國正在崛起
    雖然FPGAs的每瓦性能令人印象深刻,但在價格和性能之間找到平衡是FPGAs的主要挑戰。 它是一個晶片設計上的多核處理器網絡,有4096個核,每個核模擬256個可編程矽「神經元」,總共有100多萬個神經元。反過來,每個神經元有256個可編程的「突觸」來傳遞它們之間的信號。因此,可編程突觸的總數超過2.68億個。就基本的構建模塊而言,它的電晶體數量是54億。
  • 英偉達晶片技術崗位職位到底需要什麼人才?
    英偉達晶片技術崗位職位:物理人工智慧軟體開發崗位職責:通過ai深度學習技術,快速實現深度學習應用,如計算機視覺、圖像識別、圖像搜索、圖像理解、語義分割等。英偉達京津冀人工智慧研究院職位:軟體研發工程師崗位職責:1.編寫高效ai推理方案設計和實現框架,輸出智能推理推薦算法優化的開發文檔和工具。編寫領域自適應算法優化算法的編寫文檔和代碼實現。3.開發高效、可擴展的傳感器高精度訓練神經網絡。
  • 「讓電影音效強化的SURROUND:ai,所有電影都要重新看一遍了...
    為了讓不斷主機適應不斷進化的影音技術,Yamaha還在處理器的性能上進行了升級,三年多前的「RX-A3060」就是Yamaha第一臺內置64bit處理器的環繞放大器,處理能力更進一步提升,同時也是第一款搭載「SURROUND:ai」技術的AV環繞放大器。