FPGA適合AI邊緣計算嗎?

2020-11-27 雷鋒網

新一輪的AI熱潮對晶片提出了更高要求,不過,AI晶片的定義還沒有嚴格和公認的標準。因此,可以運行深度學習算法的CPU、GPU以及FPGA和ASIC都可以被稱為AI晶片。雖然都稱為AI晶片,但在2019年AI落地的大背景下,AI晶片的效率更值得關注。

那麼,在邊緣端,FPGA能與專為邊緣AI設計的ASIC共同推動AI的普及嗎?

三大FPGA公司整體向上

歷經併購和整合,目前全球排名前三的FPGA供應商分別是賽靈思、英特爾、萊迪思。有意思的是,前兩大供應商在今年相繼推出「最大」FPGA。8月,賽靈思宣布推出全球最大容量的FPGA Virtex UltraScale+ VU19P,這款FPGA基於臺積電16nm工藝,集成350億個電晶體、900萬個系統邏輯單元,有每秒達1.5 Terabit的DDR4存儲器帶寬、每秒達f 4.5 Terabit的收發器帶寬和超過2000個用戶I/O。

三個月後的11月,英特爾宣布推出全球容量最大的FPGA Stratix 10 GX 10M,採用14nm工藝製造,集成了443億個電晶體,核心面積約1400平方毫米,在70×74毫米的封裝面積內擁有1020萬個邏輯單元,還有25920個數據接口總線(EMIB),是此前記錄的兩倍多,每個接口吞吐量2Gbps,內部總帶寬6.5TB/s,另有308Mb存儲、6912個DSP(18×19排列)、2304個用戶I/O針腳、48個收發器(0.84Tb/s帶寬)。

顯然,賽靈思和英特爾推出更大容量的FPGA為的是滿足大數據以及雲端AI的需求,將FPGA的應用從工業和汽車更多地拓展到數據中心。在半導體行業,頭部效應尤為明顯,即便市場份額排名第三,如果萊迪思也推出大容量FPGA,境遇可能會非常艱辛。

賽靈思和英特爾在FPGA市場的調整也給了萊迪思市場拓展的機遇。過去幾年,萊迪思都專注於消費類市場,但消費類市場迭代速度非常快,需要根據不同的市場需求推出相應的產品。

萊迪思亞太區產品市場部總監陳英仁表示:「在市場需求不明確且快速變化的時候,技術很難復用。我們現在採用平臺化的新模式,這樣能夠最大化設計復用,降低開發成本及加速產品迭代。」

萊迪思亞太區產品市場部總監陳英仁

FPGA適合邊緣AI嗎?

由此看來,萊迪思在市場的變化中找到了合適的定位和產品路線。不過FPGA要在邊緣AI計算中應用,高成本和開發難度大是兩個問題。對此,陳英仁表示,很多客戶都用我們的FPGA進行量產,所以我們的FPGA價格非常友好。並且過去四年,萊迪思出貨的FPGA數量在10億片的量級,這也證明我們的產品非常可靠。

至於設計門檻,陳英仁指出,由於FPGA的生態環境不像C語言那樣方便,所以大家覺得FPGA的設計門檻比較高。這又可以分成兩部分,一部分是工具,萊迪思全新推出的平臺CrossLink-NX會使用Radiant 2.0,調試工具做了很大改善,也支持業界標準的SDC,還加了ECO編譯器,還有信號完整的分析,並且將持續保持更新,讓懂FPGA的工程師能夠更方便的使用。

另一部分是參考設計,對於那些不太懂FPGA的工程師,他們不知道這些工具的差異,需要一些參考設計才更容易上手,這也是萊迪思的強項。另外我們推出的sensAI,包含了評估、開發和部署基於FPGA的機器學習和人工智慧解決方案所需的模塊化硬體平臺、演示示例、參考設計、神經網絡IP核、軟體開發工具和定製設計服務。這些都能夠降低FPGA的設計門檻。

還有一點,FPGA本身就是並行處理,深度學習算法很多都需要並行處理,通過sensAI把AI模型轉換之後,FPGA執行AI推理非常適合。

價格友好且設計門檻在降低,但FPGA想在邊緣端應用,還需要有相對ASIC明顯的優勢才具備吸引力。對此,陳英仁對雷鋒網表示:「我們專注於把FPGA的優勢發揮出來,比如低延遲。另一個是FPGA能夠快速導入市場。還有就是FPGA的彈性,因為FPGA本身就有可編程性的優勢,I/O、配置都非常靈活。I/O接口的靈活性非常適合邊緣端,可以接入各種傳感器。」

他進一步解釋靈活性在邊緣端的重要性,如果從性能和功耗比的角度衡量, FPGA相比ASIC會顯得沒有優勢。但FPGA可以提供不同的接口,這樣就可以接不同的傳感器,並且能夠滿足產品智能化升級的需求。特別是AI技術還在不斷地演進,要對現有產品做升級的時候,由於ASIC的拓撲結構已經固化,如果一個電子廣告牌想要增加一個傳感器更好滿足需求時,ASIC就很難,而用FPGA無論是用SPI還是USB接口都能輕鬆接入。

什麼樣的FPGA更適合邊緣AI?

既然FPGA從成本、性能、開發門檻方面都在改變滿足邊緣AI的需求,那到底什麼樣的FPGA可以更好滿足邊緣AI需求?萊迪思給出的答案就是前面提到的CrossLink-NX。CrossLink-NX基於萊迪思NEXUS平臺,有功耗降低75%、可靠性提升100倍、最小尺寸以及高性能網絡邊緣計算能力的特性。

具體而言,CrossLink-NX有192個可編程I/O,D-PHY速度達到2.5Gbps,邏輯單元達到40K,主要應用於視頻橋接處理。

低功耗的實現是因為萊迪思在CrossLink-NX中使用了三星28nm FD-SOI的工藝,陳英仁介紹,我們選用的工藝中有一個很薄的Buried Oxide,可以把失效率降低100倍,也就是可靠性增加了100倍,並且靜態功耗最高可以比競爭對手降低75%。

在性能方面,CrossLink-NX提供了17K-40K的邏輯單元,可以提供低功耗以及高性能模式,並且增加了很多嵌入式存儲RAM,再加上DSP模塊,讓CrossLink-NX嵌入式存儲器/邏輯比達到170bit,比競爭對手的產品高几倍,可以更有效地處理圖形和AI推理。

高存儲器/邏輯比的同時還實現了小尺寸,CrossLink-NX採用的是優化4輸入查找表,使其產品能夠實現小尺寸,在6x6mm的面積上就具備40K的邏輯單元。陳英仁認為,4輸入的查找表到目前為止,甚至以後的產品都綽綽有餘,因為我們追求的不是最高性能,而是低功耗以及由此帶來的成本以及方便性。

當然,讓CrossLink-NX更適合邊緣AI的還有超快的I/O啟動以及快速地I/O傳輸。在傳輸速度上,萊迪思使用的是硬核的I/O提升速率,通過MIPI D-PHY,速度從之前的1.5Gbps提升到了2.5Gbps。陳英仁表示,現在大部分的SoC的速度都是2.5Gbps,所以我們的FPGA可以更容易與SoC配合滿足嵌入式視覺和邊緣AI的需求。

啟動速度方面,CrossLink-NX的I/O配置速度小於3ms,器件配置小於8ms,這個速度不僅相比MCU或SoC時間段很多,並且通過先把I/O配置好,電壓已經固定,系統也就比較穩定。

雷鋒網(公眾號:雷鋒網)了解到,CrossLink-NX一開始會先支持工業級的溫度,然後會進行車規認證。目前,CrossLink-NX已經有30多個客戶開始試用,供貨時間也比預期更加提前。

陳英仁還表示,軟體和IP也準備就緒,未來sensAI也將支持CrossLink-NX。針對AI應用,我們還可能與第三方合作提供一站式方案,通過硬體成品在搭配上參考設計,讓不懂FPGA以及AI算法的客戶能夠更加方便的應用。

雷鋒網小結

邊緣AI以及AI市場潛力巨大,在AI對晶片算力提出更高要求的時候,所有的晶片提供商都不想錯過AI帶來的機會。FPGA公司也不例外,只是FPGA本身更加擅長信號處理和網絡加速等,但為了能夠在大數據的AI的時代發揮更大的價值,排名第一和第二的FPGA公司都推出更大規模的FPGA,更好地滿足雲端AI市場。這給萊迪思一個很好的機會,通過計算平臺化的方式,最大化復用技術的同時,還能向上一步進入工業和汽車市場。

為了更好地把握好這個機會,萊迪思的新品通過性能、穩定性、I/O各方面的優化,發揮FPGA在邊緣AI中低延遲、高靈活性的特性,儘可能滿足邊緣AI計算的需求。對於市場而言,增加一種有競爭力的選擇當然一件好事,至於市場的接受度如何,我們將保持關注。

相關文章:

賽靈思眼中的未來:FPGA能適應不斷變化的汽車市場,未來十年汽車自動化將向TaaS發展

英特爾FPGA的中國棋局與「萬人計劃」

雷鋒網原創文章,未經授權禁止轉載。詳情見轉載須知。

相關焦點

  • 邊緣計算時代FPGA擁有無窮的潛力
    我們都知道邊緣計算的提出是相對而言的,相較於集中式存儲、處理的雲計算,邊緣計算更顯效率和靈活性。這樣的本質區別讓邊緣計算很難像雲計算一樣制定成熟的產業標準,雖然各雲計算組織制定的標準也很難兼容,但是巨頭效應和地域效應讓雲計算的標準可以大規模適用。而面對分門別類的邊緣計算,沒有哪一個公司敢言自己能夠制定一個適用於大部分行業或者一個大區域的標準。
  • 更適合邊緣計算的基礎架構:超融合
    假若數年後再次回首,你將不得不承認,2018就是邊緣計算廣泛進入公眾視野並快速發展的一年。在這一年裡,諮詢和評論機構對邊緣計算可以說是不吝筆墨。這一切的一切都清晰地指出,邊緣需要一些更加強大的基礎架構能力。我們認為,超融合適合邊緣計算有以下三個理由滿足新邊緣節點的定位,邊緣計算讓計算靠近數據,數據處理應用,分析應用軟體都將部署到邊緣,超融合可以為邊緣節點提供更強大的性能和存儲空間。
  • 一文了解邊緣計算和邊緣AI
    邊緣計算是雲計算的一種補充和優化。如果說雲計算是集中式、在「雲端」進行的大數據處理,那麼,邊緣計算則可以理解為邊緣側、靠近終端(例如手機、智能語音交互設備等)的大數據處理。在很多情況下,邊緣計算和雲計算是共生關係。有個形象的解釋,把雲計算和邊緣計算比喻成章魚的各器官,似乎更容易理解。作為自然界中智商最高的無脊椎動物,章魚擁有「概念思維」能力,與兩個強大的記憶系統分不開。
  • 邊緣計算和邊緣AI是什麼?兩者有什麼區別?
    在科技領域,我們聽慣了AI人工智慧,邊緣計算,卻很少涉及兩者的交叉與融合:邊緣AI,那麼邊緣計算與邊緣AI是什麼,兩者有什麼區別呢?qmaednc邊緣計算是雲計算的一種補充和優化。如果說雲計算是集中式、在「雲端」進行的大數據處理,那麼,邊緣計算則可以理解為邊緣側、靠近終端(例如手機、智能語音交互設備等)的大數據處理。在很多情況下,邊緣計算和雲計算是共生關係。有個形象的解釋,把雲計算和邊緣計算比喻成章魚的各器官,似乎更容易理解。
  • 基於fpga二維小波變換核的實時可重構電路
    項目背景及可行性分析本文引用地址:http://www.eepw.com.cn/article/266432.htm  2.1 項目名稱及摘要:  基於fpga二維小波變換核的實時可重構電路  現場可編程門陣列為可進化設計提供了一個理想的模板
  • 融入AI,邊緣計算按下升級鍵
    在5G浪潮的驅動下,智能設備、自動駕駛、VR/AR、智能製造等對於實時性、本地性有著較強需求的場景日益豐富,邊緣計算應運而生,有效提升了用戶體驗。但是,隨著強實時數據量的迅速攀升,且數據形態更加多元,邊緣計算面臨的技術挑戰更加複雜。在這一趨勢下,融入AI能力的智能邊緣計算應勢而起。
  • 融入AI 邊緣計算按下升級鍵
    但是,隨著強實時數據量的迅速攀升,且數據形態更加多元,邊緣計算面臨的技術挑戰更加複雜。在這一趨勢下,融入AI能力的智能邊緣計算應勢而起。消化指的是做一些過濾,哪些往後臺傳,哪些要處理,哪些處理完要傳到前端設備,這個過程必須在邊緣側完成。可以說,邊緣計算非常重要,是真正支持萬物智能化的關鍵點。」英特爾中國研究院院長宋繼強在近期召開的「未來智能邊緣計算論壇」上表示。
  • fpga應用領域_fpga應用三個主要方向
    fpga的優勢   1)通信高速接口設計。FPGA可以用來做高速信號處理,一般如果AD採樣率高,數據速率高,這時就需要FPGA對數據進行處理,比如對數據進行抽取濾波,降低數據速率,使信號容易處理,傳輸,存儲。   2)數位訊號處理。包括圖像處理,雷達信號處理,醫學信號處理等。
  • 模擬內存計算如何解決邊緣AI推理的功耗挑戰
    如果在數據起源處有一個本地處理引擎能夠執行部分或全部計算(推理),則可以解決這些挑戰。這在傳統的數字神經網絡實現中是很難做到的,在這種情況下,內存成為了耗電的瓶頸。這個問題可以通過多層內存和使用模擬內存計算方法來解決,這些計算方法可讓處理引擎能夠滿足在網絡邊緣執行人工智慧推斷所需的更低的毫瓦到微瓦的功率要求。
  • fpga/cpld - fpga_電子產品世界
    fpga 文章
  • 用FPGA實現FFT算法
    引言  DFT(Discrete Fourier Transformation)是數位訊號分析與處理如圖形、語音及圖像等領域的重要變換工具,直接計算DFT的計算量與變換區間長度N的平方成正比。
  • 邊緣計算總結 - CSDN
    邊緣計算是繼分布式計算、網格計算、 雲計算之 後的又-新型計算模型,是以雲計算為核心,以現代通信網絡為途徑,以海量智能終端為前沿,集雲、網、端、智四位一體的新型計算模型。Network World指出,邊緣計算將融入到幾乎所有行業中。5G的推廣只是增加了對邊緣計算的需求。在新冠病毒疫情的影響下,整個世界都在適應與以往截然不同的新常態,在此背景下,邊緣計算的重要性和潛力顯得比以往任何時候都更加重要。邊緣計算和工業物聯網(IoT)設備相結合,可以形成智慧供應鏈,幫助企業更從容地應對各種中斷情況。
  • 基於Spartan-6 FPGA的Sinc3 Filter設計
    Sinck結構的濾波器適合Σ-Δ調製器使用,可有效濾除高頻噪聲,且其實現不需要乘法即可完成。其原理結構如圖1所示。 濾波器相關文章:濾波器原理 fpga
  • 對於邊緣計算的要求是什麼
    邊緣計算將網絡邊緣上的計算、網絡與存儲資源組成統一的平臺為用戶提供服務,使數據在源頭附近就能得到及時有效的處理。這種模式不同於雲計算要將所有數據傳輸到數據中心,繞過了網絡帶寬與延遲的瓶頸,引起了廣泛的關注。 如何理解邊緣計算 近年來,大數據、雲計算、智能技術的快速發展,給網際網路產業帶來了深刻的變革,也對計算模式提出了新的要求。
  • 比特大陸發力邊緣計算,詳解終端AI晶片BM1880
    近日,比特大陸又將推出其邊緣計算晶片BM1880,用於前端圖像、視頻、語音、自然語言等等深度學習硬體加速。邊緣計算與雲計算想必雲計算大家都不陌生,雲計算又可稱之為「集中式」計算系統。在雲計算系統當中必會構建一個具有強大運算處理能力的雲端中心,用戶們可以將自己的本地的複雜數據通過網絡傳輸到雲端,藉助雲端強大的運算執行能力來快速完成數據的處理任務。
  • 如何在 FPGA 上實現雙線性插值的計算?
    根據需要計算的像素點位置計算出計算參數。3. 計算參數的整數部分作為index去選擇像素點,小數部分作為權重去計算。Difference?在FPGA上實現Interp有什麼不同?首先分析C++代碼中,Interp的計算過程,下圖是caffe中Interp的計算過程代碼。
  • 基於FPGA的實時中值濾波器硬體實現
    中值濾波作為一種非線性濾波方法,既可以消除隨機噪聲和脈衝幹擾,又可以很大程度地保留圖像的邊緣信息,得到了廣泛的運用。在許多實際應用場合,如高清視頻監控、X光圖像的降噪等,需要快速且實時地進行中值濾波,軟體實現達不到實時處理的要求,因此選用硬體實現。
  • JITStack講解:什麼是邊緣計算?邊緣計算是靠近數據源的計算基礎
    雖然雲計算是產業信息化轉型的主要推動因素,但邊緣計算正在迅速成為工業物聯網(IIoT)目標的關鍵部分,以加速數位化轉型。邊緣計算並不是一個新概念,但幾種趨勢已經結合在一起,創造了一個機會,幫助製造企業組織將大量基於機器的數據轉化為更靠近數據源的可操作智能端。什麼是邊緣計算?邊緣計算是靠近數據源的計算基礎架構。
  • 基於FPGA+MATLAB的串行多階FIR濾波器設計
    摘要 FIR濾波器的設計分為濾波器係數計算和濾波器結構的具體兩個部分。FIR濾波器具有成熟的結構,使用Matlab強大的功能使得本來繁重的計算工作變得輕鬆。在具體應用時,要根據工程當中信號的特點:採樣速率、信號帶寬等具體使用Matlab得到FIR濾波器係數。濾波器的結構實現可以使用PC軟體、單片機、微處理器、FPGA、通用DSP晶片。其需根據信號特性選擇。文中主要使用FPGA實現高速時鐘下的串行FIR濾波器結構,達到速度和邏輯資源情況下的最佳均衡。
  • MCU有AI,傳感器會ML?邊緣計算時代來了
    本次大會聚焦的3大專題「人工智慧與計算」、「工業與安全」、「雲技術與連接」,可以看到,隨著人工智慧(AI)、機器學習(Machine Learning)和物聯網(IoT)等新興技術應用的興起,ST在產品策略上也正與時俱進。