1.3MB的超輕YOLO算法!全平臺通用,準確率接近YOLOv3,速度快上45%丨...

2021-01-11 澎湃新聞

蕭簫 發自 凹非寺

量子位 報導 | 公眾號 QbitAI

最輕的YOLO算法出來了!

這是個模型非常小、號稱目前最快的YOLO算法——大小只有1.3MB,單核每秒148幀,行動裝置上也能輕易部署。

而且,這個YOLO-Fastest算法滿足所有平臺的需要。

不論是PyTorch,還是Tensorflow,又或者是Keras和Caffe,可以說是全平臺通用。

此外,作者還推出了超輕YOLO的「加大版」,同樣只需要3.5MB,就能實現比YOLOv3更好的目標檢測效果。

那麼,這麼輕的網絡,檢測效果怎麼樣?

1.3MB的超輕YOLO

檢測效果

下圖是一隻快速跑動的動物,可以看見,算法預測這隻動物為雞(chicken)的概率是95%。

不僅在動物檢測上,對於人的檢測效果也不錯。

從圖中可見,正面人物的預測概率都超過了90%,即使是接近側面的人臉,系統也能準確預測出來,只是概率會偏小,接近50%。

此外也能看見,YOLO不僅能檢測行人和動物,類似於餐桌和瓶子這樣的目標物體也能檢測出來。

當然,桌上還有其他的瓶子,不過沒有檢測出來。

而這樣的檢測效果,只需要1.3MB大小的YOLO-Fastest模型,相比於3.0MB的MobileNet-YOLOv3,參數少了65%,速度還要快上45%。

如果硬體要求沒那麼高,相比之下,還是精度更重要的話,這裡的YOLO-Fastest-XL會更加適合。

這個「加大版」YOLO-Fastest算法是一個3.5MB的算法模型,mAP要高上不少,達到了68.8%。

整體來說,YOLO-Fastest是個犧牲一定精度 (大約5%的mAP)、大幅提升速度的目標檢測模型。

結合最強移動端輕量級神經網絡食用

之所以這麼小,也是因為這個YOLO-Fastest搭配了號稱當前最強的移動端輕量級神經網絡EfficientNet-lite。

這是個比MobileNet更輕的神經網絡,但圖像分類的效果還不錯。

△ EfficientNet-lite架構

不過,這樣的壓縮會犧牲一定的精度,相比於YOLOv3,YOLO-Fastest模型的mAP只有60.8%。

但對於一些容量有限的硬體來說,已經足夠適用了。

那麼,究竟為什麼要在目標檢測算法中選擇YOLO呢?

YOLO:快速目標檢測

目標檢測算法YOLO的核心,在於它模型體積小、運算速度快。

與R-CNN系列(Fast R-CNN、Faster R-CNN等)的算法相比,YOLO的精度上不了臺,但它的速度卻是槓槓的。

檢測速度,從先驗框(下圖中五彩斑斕的框架)變換的頻次就能看出來。

之所以追求速度,是因為作為安防、自動駕駛領域的核心算法,目標檢測講究實時。

如果安防要過幾秒鐘才能檢測出竊賊的存在、或是自動駕駛汽車對路障的感知非常緩慢,那麼後果可能會不堪設想。

此後誕生出來的SSD算法,有點像R-CNN和YOLO算法的折中。但對於某些存儲體積有限的硬體來說,依舊只有YOLO才能「裝得進去」。

而只有230MFLOPS(每秒運行230萬次浮點運算)的YOLO-Fastest模型,又給算力不足的硬體提供了機會,使得它有機會在更小的機器上運行。

作者相關

有意思的是,這位在GitHub上名為dog-qiuqiu的作者,此前還寫過基於MobileNet圖像分類算法的YOLOv3(GitHub 1.1k星),同樣可以在全平臺使用。

不僅如此,這個全平臺通用的MobileNet-YOLOv3,體積和精度都要優於MobileNet-SSD。

在體積只有8.0MB(相比於SSD減少了15.1MB)的情況下,MobileNet-YOLOv3的mAP達到了73.26%(相比於SSD上升了0.56%)。

如果感興趣的話,可以一同戳下方傳送門查看這個目標檢測算法。

傳送門

1.3MB超輕YOLO:

https://github.com/dog-qiuqiu/Yolo-Fastest

比SSD效果更好的MobileNet-YOLO:

https://github.com/dog-qiuqiu/MobileNet-Yolo

— 完 —

本文系網易新聞•網易號特色內容激勵計劃籤約帳號【量子位】原創內容,未經帳號授權,禁止隨意轉載。

好課推薦 | 0基礎學Python

《動手學Python》課程由上海交大博士教研團隊研發,在線學習平臺由上海交大AI實驗室技術支持,曠視、文遠知行、圖森未來、來也科技等知名AI企業CEO/CTO力薦。

0基礎可入門,限時開放體驗課!掃碼即刻開啟Python學習之旅:

量子位 QbitAI · 頭條號籤約作者

վ'ᴗ' ի 追蹤AI技術和產品新動態

原標題:《1.3MB的超輕YOLO算法!全平臺通用,準確率接近YOLOv3,速度快上45%丨開源》

閱讀原文

相關焦點

  • 1.3MB的超輕YOLO算法!全平臺通用,準確率接近YOLOv3,速度快45%
    蕭簫 發自 凹非寺量子位 報導 | 公眾號 QbitAI最輕的YOLO算法出來了!這是個模型非常小、號稱目前最快的YOLO算法——大小只有1.3MB,單核每秒148幀,行動裝置上也能輕易部署。而且,這個YOLO-Fastest算法滿足所有平臺的需要。
  • 1.8M超輕量目標檢測模型NanoDet,比YOLO快,上線兩天Star量超200
    這個項目對單階段檢測模型三大模塊(Head、Neck、Backbone)進行輕量化,得到模型大小僅 1.8m、速度超快的輕量級模型 NanoDet-m。目標檢測一直是計算機視覺領域的一大難題,其目標是找出圖像中的所有感興趣區域,並確定這些區域的位置和類別。目標檢測中的深度學習方法已經發展了很多年,並出現了不同類型的檢測方法。
  • 使用Google Colab上的PyTorch YOLOv3
    開始谷歌Colab地址:https://colab.research.google.com/github/vindruid/yolov3-in-colab/blob/master/yolov3_video.ipynb。yolo的git倉庫:https://github.com/ultralytics/yolov3。
  • 基於YoloV3衛星圖像的儲油罐容積佔用率研究
    它的架構與Fast R-CNN完全相同,只是它使用了RPN而不是選擇性搜索,這使得它比Fast R-CNN快34倍。https://youtu.be/Cgxsv1riJhI這個模型在對象檢測模型列表中佔據首位的原因有很多。然而,最主要的原因是它的牢固性。它的推理時間非常短,這就是為什麼它很容易匹配視頻的正常速度(即25fps)並應用於實時數據的原因。
  • YOLOv4來了,大型調優現場,速度和準確率俱佳
    作者 | VincentLee來源 | 曉飛的算法工程筆記簡介論文提出YOLOv4,從圖1的結果來看,相對於YOLOv3在準確率上提升了近10個點,然而速度並幾乎沒有下降,論文主要貢獻如下:提出速度更快、精度更好的檢測模型,僅需要單張1080Ti或2080Ti即可完成訓練。
  • 從R-CNN到YOLO,一文帶你了解目標檢測模型(附論文下載)
    可以先看大數據文摘翻譯的這個視頻了解YOLO:TED演講 | 計算機是怎樣快速看懂圖片的:比R-CNN快1000倍的YOLO算法有了YOLO,不需要一張圖像看一千次,來產生檢測結果,你只需要看一次,這就是我們為什麼把它叫"YOLO"物體探測方法(You only look once)。
  • 從零開始PyTorch項目:YOLO v3目標檢測實現
    在這之中我獲得的最大啟發就是意識到:學習目標檢測的最佳方法就是自己動手實現這些算法,而這正是本教程引導你去做的。在本教程中,我們將使用 PyTorch 實現基於 YOLO v3 的目標檢測器,後者是一種快速的目標檢測算法。本教程使用的代碼需要運行在 Python 3.5 和 PyTorch 0.3 版本之上。
  • 百度OCR通用中英文字符識別準確率達95%以上
    來源:格隆匯格隆匯11月1日丨百度大腦開放日OCR文字識別專場昨日在上海召開,百度AI技術生態部產品經理為開發者們詳細介紹了百度大腦最新的開放能力,百度視覺技術部韓鈞宇深入分享了百度大腦OCR文字識別方向的最新技術與趨勢,並邀請華夏保險上海分公司
  • 百度全功能AI開發平臺BML自動超參搜索技術全面解析
    百度全功能AI開發平臺BML帶著免費算力額度與自動超參搜索能力來了!先來介紹百度最近全新升級的BML,何方神聖?全功能AI開發平臺BML(Baidu Machine Learning),是為企業和個人開發者提供機器學習和深度學習一站式AI開發服務,並提供高性價比的算力資源,助力企業快速構建高精度AI應用。
  • 引入Powerball 與動量技術,新SGD優化算法收斂速度與泛化效果雙...
    為此,[1]中也開發了幾類Powerball方法的變形,它們在經驗上都分別優於標準的優化方法,特別是在初始迭代中。在[1]中的基於多個實際數據集上的實驗表明,文中所提出的方法可以使(隨機)梯度下降法和L-BFGS方法的收斂速度提高10倍。
  • 盤點網際網路大會上的尖端科技
    當車輛接近目的地的時候,系統會自動將車輛停入車位完成旅程。  IBM Watson人工智慧。Watson人工智慧類腦計算機,曾在美國一個熱門的電視智力問答節目中戰勝了兩位人類冠軍選手,將在醫療領域進行廣泛應用。  百度大腦。百度大腦有三個組成部分:一個是超大規模的計算,一個是先進的算法,另外一個是海量的大數據。
  • 一種基於狀態觀測器的PMSM速度觀測算法
    該算法以電機轉矩電流和機械角度作為輸入量,根據電機的數學模型和機械特徵方程,構建速度觀測器,來實現對永磁同步電機速度的精確控制。仿真及實驗結果表明:該方法與碼盤M法測速相比,測得的速度更加精確,並且超調量小,響應快,能起到相位補償的作用,解決了碼盤固有的相位滯後問題,同時,在負載發生變化時系統仍然能保持很好的穩定性和控制精度。
  • 夏日專刊AI產品上新升級集錦,50餘項軟硬能力加速場景落地
    >百度飛槳推出工業級目標檢測模型 PP-YOLO,精度45.9%,推理速度72.9 FPS。2)離線 SDK 煥新升級:功能更全面:支持全種類車牌,包括常見的藍牌、綠牌、黃牌,以及大型新能源、領使館車牌、警牌、軍牌、港澳牌、民航車牌等特殊車牌。性能更強勁:單張圖片的處理速度可達 100ms 內,例:驍龍821上僅 90ms。
  • 使用Yolov5進行端到端對象檢測
    在此之後,Alexey Bochkovskiy在darknet上創建了YOLOv4,號稱比之前的迭代具有更高的平均精度(AP)和更快的結果。現在,Ultralytics已經發布了YOLOv5,具有可比的AP和比YOLOv4更快的推斷時間。這就產生了許多疑問:新版本是否保證了與YOLOv4相似的準確性?無論答案是什麼,這絕對是目標檢測界發展速度的一個標誌。
  • 世界上最快的飛機速度可達9.7馬赫,接近音速的十倍
    世界上最快的飛機近日,美國國家航空航天局(NASA)官網稱,NASA將測試F-18噴氣式飛機在超音速飛行時,低空湍流對音爆的影響,並希望綜合以往研究成果,設計未來幾乎消除音爆的「低空飛機」。而一馬赫即一倍音速:馬赫數小於1者為亞音速,馬赫數大於5左右為超高音速;馬赫數是飛行的速度和當時飛行的音速之比值,大於1表示比音速快,同理,小於1是比音速慢。馬赫作為表示速度的學術量詞,用於表示飛機飛彈的飛行速度。由於聲音在空氣中的傳播速度隨著不同的條件而不同,因此馬赫也只是一個相對的單位,每「一馬赫」的具體速度並不固定。
  • 深度| 曠視人工智慧算法平臺Brain++憑什麼在烏鎮網際網路大會獲獎?
    在此次大會的重頭戲「世界網際網路領先科技成果」發布活動上,人工智慧獨角獸曠視發布了名為Brain++的人工智慧算法平臺。據曠視聯合創始人兼首席技術官唐文斌介紹,Brain++是「一套端到端的AI算法平臺,目標是讓研發人員獲得從數據到算法產業化的一攬子技術能力,不用重複造輪子也可以推進AI快速落地。我們的Brain++還引入了AutoML技術,可以讓算法來訓練算法,讓AI來創造AI。」
  • AI算法加速全基因組檢測,疑似病例可更快確診
    (天下網商記者 王安憶)阿里巴巴達摩院正在用AI算法抗擊新型冠狀病毒感染的肺炎疫情。2月1日,浙江省疾控中心上線自動化的全基因組檢測分析平臺。利用阿里達摩院研發的AI算法,可將原來數小時的疑似病例基因分析縮短至半小時,大幅縮短確診時間,並能精準檢測出病毒的變異情況。
  • 這種方法檢測前列腺癌準確率接近100%
    然而,由於診斷準確率低至30%,相當多的患者需要進行額外的侵入性活檢,從而遭受由此產生的副作用,例如出血和疼痛。韓國科學技術研究所(KIST)宣布,其開發了一種僅在20分鐘內就可從尿液中診斷前列腺癌的技術,準確率幾乎達到100%。研究小組通過將人工智慧分析方法引入基於電信號的超靈敏生物傳感器來開發這種技術。該研究已發表在期刊ACS Nano上。
  • 通用智慧機器人公司,Flexiv非夕科技完成超1億美金B輪融資
    非夕科技近日宣布完成超1億美金B輪融資,投資方是由美團、珠江集團、新希望集團、製造業關聯私募Longwood、雲鋒基金、招商局資本、高榕資本和金沙江創投組成的。  旗下機器人產品已具備大規模生產能力  Flexiv非夕科技是一家全球領先的通用智慧機器人公司。它主要研發和應用最先進的仿人化機器人和人工智慧技術,為全行業客戶提供出基於非夕機器人系統的創新性的解決方案以及服務。