a&s 功能實測 比特大陸AI邊緣計算模組算豐SM5

2020-11-29 站長之家

隨著人工智慧在安防、泛安防等領域迅速落地和普及,各類圖像視覺類AI算法落地的精度和實際效果在提升,獲得了更深廣的業務價值,如安防領域的人臉布控、人車視頻結構化等,泛安防的社區園區通行,新零售的VIP客戶識別等,都是AI技術商業化的典型場景。

同時,視覺類AI算法的深度學習計算,也逐步從雲端部署擴展到邊緣部署。邊緣的設備比雲端多1- 2 個數量級,業內對邊緣AI計算硬體的需求快速升溫,大家呼喚高算力、低功耗、接口豐富的晶片和模組方案的出現,來替代原來的CPU、GPU方案。

而比特大陸算豐AI計算模組SM5,定位為國內最強算力的AI邊緣計算模組,成為讓人眼前一亮的選擇。它基於AI專用晶片(ASIC),在算力上突破了17 TOPS量級,達到了驚人的 16 到 30 路的潛在視頻計算分析能力。難得的是,在高算力同時保持了相對低功耗、被動式無風扇散熱、接口豐富等優點。可以說是國內AI邊緣計算模組中的領軍產品,吸引了諸多安防、泛安防客戶的眼球。不僅如此,作為國產廠商的純自主研發產品,也為特種行業領域提供了新的選擇。比特大陸算豐AI計算模組SM5 實測效果如何,我們一一驗證。

小體積 大集成

從外形來看,比特大陸算豐AI計算模組SM5 (Sophon SM5)極為小巧,尺寸僅為普通信用卡大小,算連接器為87×65×8mm,不算連接器為87×65×3mm。底座為 144 針高密接口,供客戶開發底板,嵌入到各類設備之中。

該模組採用寬溫設計,散熱方案可以選配比特大陸的被動或主動散熱方案,客戶也可自行設計。可適應-20℃到+55℃的工作環境,有效降低惡劣環境對模組的影響,從而支持系統的持續運作。模組滿足極端環境的作業需求,可應用在室外半封閉場所。

比特大陸該模組採用雙模驅動,內置12G內存,既可作為AI計算的從設備(PCIE mode),也可作為主設備獨立運行(SOC mode),可支持FP32(2.2T)高精度的計算,INT8 計算經過自動化編譯校準的精度損失可小於<0.5%。

另外,該模組接口豐富,具有10+接口類型。支持PCIE EP/ PCIE RC / Ethernet / RS485/ RS232/ GPIO /SDIO / PWM等接口。擴展性強,可擴展USB/SATA/HDMI等,可擴展SATA存儲,可擴展4G/5G/wifi等。

總的來說,比特大陸算豐AI計算模組SM5 體積小、低功耗、雙網口、接口豐富,工作寬溫,高集成度,可以方便的被集成在各類邊緣計算設備、嵌入式設備、自動化機器之中。

SM5 模組頂面圖

SM5 模組底面圖

自主研發晶片 算力強大

比特大陸算豐AI晶片是其純自主研發產品,具備200+專利申請。比特大陸算豐AI計算模組SM5 基於比特大陸算豐AI晶片BM1684,為比特大陸的第三代雲端AI晶片,屬於歷代規格最高,算力最強,同時 3 代的產品研發迭代,在客戶持續使用反饋中,產品的成熟度得到了諸多行業客戶的打磨和提升,進入了成熟階段。

判斷晶片的主要標準即為算力、功耗。a&s實測該模組的算力達到17.6TOPS,在Winograd卷積加速下最高可達35.2TOPS。ARM CPU下算力最強, 8 核A53 主頻2.3GHz,邊緣AI晶片內最強,可靈活開發應用。

實測中,該模組Resnet50 的測試吞吐可達到1000 張/秒以上。安防的應用要從整體的視覺應用層面,端到端的來看性能指標。典型的安防視覺AI計算過程包含從外部視頻流/圖片流進入模組,網口取數據,視頻/圖片解碼,視頻前後處理,AI計算,同時CPU參與部分計算,最終輸出等。從該模組的測試結果看,其最高支持 32 路30FPS的1080P解碼,支持H264/H265 格式,支持視頻編碼最高960 FPS;具備硬加速的圖像前後處理能力(Crop/Resize/色域變換),有效提升應用性能。

常見Resnet50 等神經網絡運行典型功耗12W以內, 16 路視頻流全流程分析典型功耗為16W。在滿載情況下,典型功耗也不到20W功耗。可以在無風扇的被動散熱方案下,持續有效的長期運行。

業界比對測試 效果良好

除了從典型安防視覺AI計算過程衡量模組的算力和整體性能,a&s將英偉達TX2、華為ATLS200 等模組方案與比特大陸算豐AI計算模組SM5 進行橫向對比測試,同類對比技術規格來看,算豐SM5 的技術指標在CPU、AI算力、視頻解碼、內存、乙太網埠等等都具備較大的優勢,可以說說得上是業內超強算力。

從測評數據中可以看出以下幾點:

在AI算力方面,與TX2 、ATLS200 相比具有明顯優勢;

在視頻解碼上,是TX2 、ATLS200 的兩倍;

內存為12GB,是TX2 、ATLS200 的1. 5 倍;

乙太網埠是 2 個,而TX2 、ATLS200 均只有 1 個;

從測評數據來看,比特大陸算豐AI計算模組SM5 的優勢相對英偉達TX2、華為ATLS200 優勢明顯,雖然功耗相對較大,但與其餘對比項相結合後,性價比仍然最高。

測試數據來源為比特大陸實驗室

算力和AI分析路數

從實際應用和神經網絡benchmark兩個角度測試比特大陸算豐AI計算模組SM5。

該模組在安防的實際應用主要指標為可接入的視頻路數和視頻分析應用能力。在安裝 1 塊SM5 模組搭載的測試底板後,引出來網絡、電源等接口,將視頻流伺服器發過來視頻進行多路處理和分析,並將檢測人臉框打在視頻流上編碼輸出顯示。在 16 路1080p視頻流輸入的情況下,每路視頻實時畫面達到 10 人臉以上,單個SM5 模組可以實現完全實時的滿幀的處理人臉檢測和跟蹤。

上圖是 16 路1080P的滿幀處理情況,僅僅為初步部署,並未進行優化。用戶可以自行開發算法軟體,並進行適度優化,完全有可能實現單個模組超過 16 路甚至 30 路視頻流的人臉檢測分析,或者視頻結構化的業務分析能力,可以說在應用端到端的算力非常強大。

SM5 模組的實際應用算力實測非常強,相應的神經網絡模型速度肯定也很快。a&s將SM5 模組、Nvidia TX2 模組,以及Huawei ATLAS200 模組做了性能實測比對,在幾種典型的神經網絡分類模型測試中,吞吐數據如下表:

測試數據來源為比特大陸實驗室

     從實測結果來看,在性能上,SM5 相比TX2 有十倍級別的性能優勢。相比ATLAS 200,雖然理論峰值標稱算力SM5 和ATLAS200 很接近(17.6T vs 16T),但是從實測來看,SM5 的性能倍數在最典型Resnet50 上有1. 5 倍的優勢,在Mobilenet上有2. 38 倍的優勢!這說明,標稱算力和實際獲得的算力具有一定的差別。算豐SM5 具有較高的有效計算利用率。

總的來看,無論是實際應用的性能,還是神經網絡模型的速度吞吐,SM5 模組都是很強大的,和業內其他產品相比也有較大的優勢。

工具鏈完備,易用度高

對於開發者而言,都希望開發簡單易用,特別是從CPU,GPU等的以前的模型和算法,能夠比較輕易的轉到新的AI硬體上來。而比特大陸的算豐AI晶片的多種產品(板卡、模組、盒子),保持統一的工具鏈和系統軟體。

其中工具鏈完備,開發友好:

包括底層驅動環境、編譯器、推理部署工具等一系列軟體工具;

支持Caffe、Tensorflow、PyTorch、PaddlePaddle等深度學習框架,離線編譯和校準工具易用;

完備的性能監控工具、神經網絡運行庫、視頻編解碼庫、圖像編解碼庫、圖像處理庫;

可提供算法測試用例,包括人臉檢測、物體檢測等。

可應用場景廣泛

比特大陸算豐AI計算模組SM5 的定位是被集成,所以應用場景是多種多樣的,包括了AI邊緣計算伺服器,智能NVR,AI邊緣計算盒,機器人,大中型無人機等等。模組的主要功能就是進行視覺AI的計算,能夠為傳統產品附加AI功能,支持人臉檢測與識別、面部表情分析、物體檢測與識別、車牌識別、聲紋識別等,可應用於人臉識別、自動駕駛、城市大腦、智能安防、智能醫療等人工智慧場景,應用領域廣泛。

可以說,BM1684 作為比特大陸多年AI技術積累和沉澱的第三代AI晶片,構建的AI模組具有鮮明的特點,優勢諸多。

產品特色

1、超強算力、低功耗、自主晶片。

2、易被集成、低功耗、雙網口、接口多。

3、體積小,被動散熱,易集成。

4、雙模驅動,接口豐富,擴展性強。

5、工具鏈完備,易用度高。

點評

這是一款算力超強的AI計算模組,從應用性能和神經網絡實測來看,算力非常強大,可以說是目前階段業內最強。同時具備視頻解碼、後處理、CPU強大能力,有可能在視覺AI全流程起到完美的加速效果。

同時還保持了易集成,低功耗等特點,如此強大的邊緣計算模組,確實是業內的強算力模組的最佳選擇之一。預計算豐SM5 模組會在安防、智慧城市、機器人、新零售等領域,加速AI在業務中的普及和落地。

主要規格參數

免責聲明:「站長之家」的傳媒資訊頁面文章、圖片、音頻、視頻等稿件均為自媒體人、第三方機構發布或轉載。如稿件涉及版權等問題,請與我們聯繫刪除或處理。稿件內容僅為傳遞更多信息之目的,不代表本網觀點,亦不代表本網站贊同其觀點或證實其內容的真實性,更不對您的投資構成建議。我們不鼓勵任何形式的投資行為、購買使用行為。

相關焦點

  • 比特大陸:去年已免去詹克團的公司執行董事、法定代表人職務
    DoNews 5月27日消息(記者 吳麗)5月27日,北京比特大陸科技有限公司官方微博發布聲明稱,該公司已於2019年10月28日通過股東決定免去詹克團的公司執行董事、法定代表人職務,且公司已於2019年11月5日通過執行董事決定免去詹克團經理職務。因此,詹克團無權以公司法定代表人、執行董事或經理的名義從事任何行為。
  • 聚焦邊緣智能計算,「OPEN AI LAB」要10倍提升AI開發部署效率
    隨著越來越多的物聯網終端設備在各個行業加速部署,邊緣計算的重要性日益凸顯,AI算法也正在逐步從雲端下沉到邊緣節點中去運行。據IDC預計,到2025年,全球將有1500億個終端設備接入網絡,其中超過70%的數據將在網絡邊緣側被結構化處理。
  • 科普:論垃圾分類與邊緣計算的關係
    這就成了真正的邊緣計算。 事實上,我個人認為,將分揀工作交給小區大媽,是現階段非常完美的解決方案。 一方面,可以減少普通居民的算力壓力(節約腦子,也延緩了培訓周期)。另一方面,分揀工作交給專業人士,效率會更高(他們對分揀更加熟練)。
  • 為什麼 2020 年代屬於量子計算?
    「經典」計算通過常規的二進位(通常稱為「0」和「1」)來處理信息,另一方面,像量子疊加(量子粒子同時存在多個量子狀態,而不是在一個位置和狀態中)和量子糾纏(具有糾纏態的兩個粒子無論相距多遠,只要一個狀態發生變化,另外一個也會瞬間發生變化)這樣的量子原理,可以用來讓計算機處理超出常規二進位原理以外的問題。因此,量子計算的基本單位不是比特,而是量子比特(qubit)。
  • 微星AfterBurner 為 10 系顯卡開啟一鍵超頻:實測提升 3.9%
    IT之家1月1日消息 不久前,微星超頻軟體 Afterburner 4.6.0 beta10發布,為英偉達的10系帕斯卡顯卡增加OC Scanner一鍵超頻,外媒用GTX 1080實測提升性能3.9%,不是很明顯。
  • 優刻得邊緣計算產品正式更名UEC,打造低延時、高性能、低成本計算...
    2021年已至,為了以全新的面貌迎接新一年,優刻得邊緣計算產品線全面煥新,正式更名為 UEC(UCloud Edge Computing)。邊緣計算作為雲計算的補充和延伸,是將雲計算的計算、存儲等能力擴展到網絡邊緣,提供低時延、高可用和隱私保護的本地計算服務,產生更快的網絡服務響應,解決雲計算中心時延長、受網絡環境制約等問題,兩者相輔相成。
  • 姚建銓院士:「4 3 2 1」維度立體闡述邊緣計算
    原標題:姚建銓院士:「4 3 2 1」維度立體闡述邊緣計算 如今,5G已大規模商用,人工智慧正突飛猛進,邊緣計算技術也迎來快速發展。據IDC數據顯示,未來超過50%的數據需要在邊緣側進行存儲、分析、計算,到2024年全球邊緣計算市場將達到2506億美元。
  • 年度AI晶片盛會12月1日北京見!終極議程彩蛋劇透
    VeNEETC-電子工程專輯GTIC 2020 AI晶片創新峰會還匯聚了我國明星自動駕駛晶片創企——黑芝麻智能與地平線,黑芝麻智能科技創始人&CEO單記章、地平線聯合創始人&技術副總裁黃暢將分別為大家分享自動駕駛計算晶片的創新突圍,以及AI晶片在軟體2.0時代下的思考。
  • 美權威報告:量子計算十年內無法落地
    也許更重要的是,量子計算研究人員可以期盼n年的資助,因為誰也猜不準製造出商業上實用的量子計算機需要多久。該報告名為《量子計算行業的進展和前景》,十大研究結果中的第一個是這樣描述現狀的:鑑於量子計算的現狀和最近取得進展的速度,在未來十年內製造出能夠破解RSA2048或類似的基於離散對數的公鑰加密系統的量子計算機是非常意外的事。
  • 年度AI晶片盛會12月1日北京見!終極議程彩蛋劇透|智東西GTIC 2020
    GTIC 2020 AI晶片創新峰會還匯聚了我國明星自動駕駛晶片創企——黑芝麻智能與地平線,黑芝麻智能科技創始人&CEO單記章、地平線聯合創始人&技術副總裁黃暢將分別為大家分享自動駕駛計算晶片的創新突圍,以及AI晶片在軟體2.0時代下的思考。
  • 2017⇆2019,AI三年浮沉記
    據 Gartner 發布的 2017 年 《技術成熟度報告》 顯示,其中出現了 8 項新增技術成果,其中包括 5G、人工通用智能、深度學習、深度強化學習、數字孿生、邊緣計算、無伺服器 PaaS 以及認知計算。
  • 北鬥星C2物聯網集成灶實測 好廚房從這裡開始
    進風口位置風速實測    這裡我們也對北鬥星C2油網位置風速進行了測量。北鬥星C2煙機擁有兩個檔位,一檔實測風速約為3.6m/s,二檔實測在5.0m/s左右。我們模擬一般用戶烹飪身位進行測量(測試儀距離煙機進風口約為30cm處),在環境噪音45.3db的條件下,北鬥星C2一檔噪音實測62dB(A)左右,相當於聲壓級48dB,二檔實測噪音約為68dB(A)左右,相當於聲壓級56dB,這基本與我們日常交談的音量相仿。
  • 手掌中的雲挖礦——創星比特
    在目前眾多雲挖礦的行業中,更受歡迎的莫過於創星比特了。現在,創星比特提供了—個全面的數字貨幣雲挖礦平臺,具有不同規模的數字貨幣挖礦能力,可以為有不同需求的客戶提供不同的雲挖礦產品服務。創星比特的願景是讓每個人都能輕鬆便捷地參與數字貨幣挖礦,—起享受數字貨幣時代帶來的紅利。使用便捷,服務專業創星比特連續運行三年之久,期間不斷更新改造,只為給客戶更好的挖礦體驗!
  • 張首晟生前演講:他眼中的量子計算人工智慧和區塊鏈
    如果用量子世界來做計算的話就能夠秒算,把所有的可能性一下子算出來,因為量子世界有它本真的平行性,這是量子計算最基本的概念。但是要真正造出這個量子計算機是非常困難的,比如最基本的單位,經典計算機最基本的單位是比特,就是信息要不是0就是1,用0、1就能夠表達所有的信息,這是經典計算機的概念。但是在量子世界裡面,一個粒子同時穿過左孔,又穿過右孔,處在某一種疊加的狀態。
  • 《霍比特人》曝中文海報預告 2月22日魔幻起航
    搜狐娛樂訊 曾憑藉魔幻經典系列《指環王》收穫無上榮耀的金獎導演彼得-傑克遜將攜史詩級魔幻系列《霍比特人》三部曲再度襲來,而這部由《指環王》前傳美譽掛帥的全新魔幻序曲《霍比特人:意外之旅》將於2月22日登陸內地院線,成為開年巨獻。
  • AMD銳龍R5-3600X散熱不容小窺,配240水冷組裝機實測
    CPU供電部分有巨大的散熱鰭片覆蓋,這能保證CPU供電模組不會過熱影響供電穩定。主板配有四條內存插槽,官方宣稱最高支持3466MHz頻率的內存,支持AXMP內存一鍵超頻技術,使用了DDR4 Boost技術,優化了內存布線,內存兼容性對比上一代有了不少提升。
  • 荒野亂鬥:全能射手8比特,攻擊範圍遠傷害高,卻有一個致命缺點
    8比特在荒野亂鬥中的存在感一般,官方給出的定位是射手,我卻更樂意稱它為輔助。從功能上來說,它是全能的,攻擊範圍比柯爾特都遠。可從實用角度來說,它並不適合作為主力輸出,因為自身移速特別慢,這也是它的致命缺點!
  • 花千元檔錢,玩旗艦級功能——魅族16Xs手機評測
    魅族16Xs採用了匯頂第二代SupermTouch屏下指紋光學方案,官方宣稱最快識別速度可達0.2s,不過實際解鎖速度基本上在1s左右,並且無法做到一觸即解,需要按壓才可以實現解鎖,初此之外,當手指上有水漬時無法使用指紋解鎖。與屏下指紋解鎖相比,面部識別速度明顯要快許多,在光線充足和微光的使用環境下,魅族16Xs基本上可以做到一開即解,並且準確率非常高。