阿里AI再獲圖像識別冠軍,可將深度學習算法壓縮100倍

2020-12-05 DoNews

DoNews 7月30日消息(記者 趙晉傑)在CVPR 2019的低功耗圖像識別挑戰賽(LPIRC ,Low-Power Image Recognition Challenge)上,阿里AI獲得在線圖像分類任務第一名。這也意味著,阿里AI識別百萬圖像的算法,在手機上也能跑起來了。

CVPR是計算機視覺領域的頂級學術會議,低功耗圖像識別挑戰賽由IEEE Rebooting Computing (RC)項目負責發起,通過識別準確率、執行速度和能量消耗三項指標,考察AI視覺識別技術在輕量級設備上的表現。

阿里AI參加了挑戰賽三項任務之一的在線圖像分類。比賽使用Pixel 2 手機,要求AI在 10 分鐘內分類20000 張圖像,考察分類速度和精度。

LPIRC2019官網宣布的比賽結果,阿里AI獲得在線圖像分類任務第一名

挑戰賽使用Imagenet數據集作為訓練數據,AI學習了約 120 萬張涵蓋1000個類別的圖像,實現67.4%的分類精度,比官方提供的基準線高3.5%。在最終的測試中,阿里AI實現了23ms的單張圖片分類速度,排名第一。

這項技術可將深度學習算法壓縮40到100倍,便捷地部署於端側設備,在智慧型手機、自動駕駛、工業自動化等領域應用前景廣闊。(完)

相關焦點

  • 一場深度學習引發的圖像壓縮革命
    AlexNet 開啟了深度學習黃金時代,隨之而來是深度學習在圖像識別上的蓬勃發展:2013 年,ZF Net 以 11.2% 的低失誤率奪得 ILSVRC 冠軍;2014 年,VGG Net 在ILSVRC「分類及定位」比賽單項賽上的失誤率為 7.3%,同年,GoogLeNet以 6.7% 的失誤率取得 ILSVRC 冠軍
  • 深度學習與圖像識別 圖像檢測
    特別適合處理大數據       a、用較為複雜的模型降低模型偏差       b、用大數據提升統計估計的準確度       c、用可擴展的梯度下降算法求解大規模優化問題這個大數據是除了數量上的大,還有更重要的是維度的大,很多算法本身是無法處理高緯度數據的,例如Kernel學習機相關的算法, 雖然理論上是先將數據向高維空間映射
  • 從傳統圖像算法到深度學習,文字識別技術經歷了這些變化
    文字識別的發展大致可以分為兩個階段,分別是傳統圖像算法階段和深度學習算法階段。傳統圖像算法2012年之前,文字識別的主流算法都依賴於傳統圖像處理技術和統計機器學習方法實現,利用光學技術和計算機技術把印在或寫在紙上的文字讀取出來,並轉換成一種計算機能夠接受、人又可以理解的格式。
  • 圖像識別中的深度學習【香港中文大學王曉剛】
    深度學習是近十年來人工智慧領域取得的重要突破。它在語音識別、自然語言處理、計算機視覺、圖像與視頻分析、多媒體等諸多領域的應用取得了巨大成功。現有的深度學習模型屬於神經網絡。神經網絡的起源可追溯到20世紀40年代,曾經在八九十年代流行。神經網絡試圖通過模擬大腦認知的機理解決各種機器學習問題。
  • 圖鴨科技 CVPR 2019 CLIC 圖像壓縮挑戰賽冠軍方案全解讀
    圖像壓縮挑戰賽中,圖鴨科技所提出的算法 TucodecSSIM 奪得了 MS-SSIM 和 MOS 兩項指標的冠軍,算法 TucodecPSNR 奪得了 PSNR 指標的冠軍,算法 TucodecPSNR40dB 則奪得高碼點圖像壓縮 Transparent Track 的冠軍。
  • 用深度學習理解遙感圖像,識別效率提升90倍 | PaddlePaddle出品
    一個熟練解譯人員從這樣的遙感圖像中檢測出來所有的高爾夫球場,需要15分鐘左右。而現在,深度學習技術改變了這項工作的面貌。只需10秒,就能夠在這樣的圖中,自動檢測出高爾夫球場。相比之下,效率提高90倍。但在從傳統的人工+算法模式到現在深度學習的模式切換中,還經歷了不少困難。用AI理解遙感圖像,有什麼難的?圖像識別,可以說是當前AI領域比較成熟的技術了,各種用於圖像理解的深度學習模型層出不窮,而且在特定領域已達到了人類同等水準。
  • 你不了解的卷積神經網絡:新一代圖像視頻壓縮技術
    在低壓縮比情形下(比如壓縮比小於 10:1),傳統的 JPEG 圖像質量有可能比 JPEG2000 好。JPEG2000 在高壓縮比的情形下,優勢才開始明顯。整體來說,JPEG2000 相比於傳統 JPEG,仍有很大技術優勢,通常壓縮性能可提高 20% 以上。當壓縮比達到 100:1 時,JPEG 壓縮的圖像已經嚴重失真並開始難以識別了,而 JPEG2000 的圖像仍可識別。
  • 100個深度圖像分割算法,紐約大學UCLA等最新綜述論文
    可作為相關領域從業者的必備參考文獻。戳右邊連結上新智元小程序了解更多! 圖像分割(Image Segmentation)是計算機視覺的經典問題之一,受到了廣泛關注,每年在各大會議上都有大量的相關文章發表。在前深度學習時代有大量的方法提出,比如分水嶺、GraphCut等。隨著深度學習的興起,大量的算法提出如R-CNN、Mask-RCNN等。
  • 推薦算法系統/人臉識別/深度學習對話機器人高級實戰課
    包含了推薦算法系統實戰、深度學習人臉識別實戰、深度學習對話機器人實戰等高級前沿的精品課程,下面分別介紹下各個實戰項目:1、推薦算法系統實戰首先推薦系統不等於推薦算法,更不等於協同過濾。2、深度學習人臉識別實戰人臉識別,是基於人的臉部特徵信息進行身份識別的一種生物識別技術。
  • Python深度學習之圖像識別
    前面有幾講也是關於機器學習在圖像識別中的應用。今天再來講一個關於運用google的深度學習框架tensorflow和keras進行訓練深度神經網絡,並對未知圖像進行預測。導入python模塊導入圖像數據合併列表數據將圖片數據轉化為數組顯示一張圖片訓練神經網絡我們可以看到測試集的準確率達到99.67%
  • 基於小波包變換和壓縮感知的人臉識別算法
    壓縮感知理論的出現和發展,給人臉識別帶來了新的啟發,使得基於稀疏表示的人臉識別技術得到了廣泛研究。傳統的基於稀疏表示的人臉識別是利用壓縮感知超完備庫下的稀疏表示,將訓練圖片直接構造為冗餘字典,再求解重構算法下的最優稀疏線性組合係數,然後根據這些係數來對人臉圖像進行分類。
  • 深度學習助力數據壓縮,一文讀懂相關理論
    例如,gzip 的壓縮原理是:先使用 LZ77 算法的一個變種進行壓縮,對得到的結果再使用靜態或動態哈夫曼編碼的方法進行壓縮;bzip2 的壓縮原理為:使用了一個遊程編碼器進行編碼,接下來塊排序壓縮和 Move-to-Front(MTF ) 變換進一步產生大量相同符號,進一步使用另一個遊程編碼器進行編碼。
  • 深度學習:神經網絡算法的昨天、今天和明天
    反向傳播算法模擬的正是大腦的反饋機制。之後的1994年,計算機科學家Yann LeCun在Geoffrey Hinton組內做博士後期間,結合神經認知機和反向傳播算法,提出了用於識別手寫郵政編碼的卷積神經網絡LeNet,獲得了99%的自動識別率,並且可以處理幾乎任意的手寫形式。這一算法在當時取得了巨大的成功,並被應用於美國郵政系統中。三、深度學習的爆發儘管如此,深度學習並沒有因此而熱門。
  • 圖鴨科技獲CVPR 2018圖像壓縮挑戰賽單項冠軍,技術解讀端到端圖像...
    、深度學習等一些新的方式引入到圖像壓縮領域。壓縮表徵的先驗概率通過使用超先驗自編碼器的拉普拉斯分布來建模,並與變換自編碼器進行聯合訓練。為了去除低碼率圖像的壓縮失真和模糊,我們提出了一種基於卷積的高效後處理模塊。最終,考慮到 CLIC 挑戰賽對碼率的限制,我們使用一個碼率控制算法來對每一個圖像自適應性地分配碼率。在驗證集和測試集上的實驗結果證明,使用感知損失訓練出的該優化框架能夠實現最優的 MS-SSIM 性能。
  • OpenCV+深度學習預訓練模型,簡單搞定圖像識別 | 教程
    pyimagesearch網站今天發布了一份用OpenCV+深度學習預訓練模型做圖像識別的教程,量子位編譯整理如下:最近,OpenCV 3.3剛剛正式發布,對深度學習(dnn模塊)提供了更好的支持,dnn模塊目前支持Caffe、TensorFlow、Torch、PyTorch等深度學習框架。
  • 技術| 基於深度學習圖像識別的變電站監控系統
    打開APP 技術 | 基於深度學習圖像識別的變電站監控系統 發表於 2019-07-22 08:29:10 基於計算機網絡技術以及無線通信技術和視頻監控技術,研究深度學習圖像識別的變電站基建安全行為監控系統。
  • 第85講 Python深度學習之圖像識別
    前面有幾講也是關於機器學習在圖像識別中的應用。今天再來講一個關於運用google的深度學習框架tensorflow和keras進行訓練深度神經網絡,並對未知圖像進行預測。導入python模塊導入圖像數據
  • 基於深度學習的人臉識別技術全解
    深度學習在人臉識別上有 7 個方面的典型應用:基於卷積神經網絡(CNN)的人臉識別方法,深度非線性人臉形狀提取方法,基於深度學習的人臉姿態魯棒性建模,有約束環境中的全自動人臉識別,基於深度學習的視頻監控下的人臉識別,基於深度學習的低解析度人臉識別及其他基於深度學習的人臉相關信息的識別。
  • 基於小波變換的圖像壓縮算法改進研究
    小波變換彌補了SIFT的不足,它將原始信號通過伸縮和平移之後,分解成一系列具有不同空間解析度、不同頻率特性和不同方向特性的子帶信號,這些具有良好時頻特性的子帶信號可以用來表示原始信號的局部特徵,從而實現了對原始信號進行時間和頻率上的局部化分析。因此,小波變換被廣泛應用於圖像分析、語音編碼和模式識別等領域。
  • 深度學習不是萬靈藥!神經網絡3D建模其實只是圖像識別?
    但近期一項研究表明,幾乎所有基於深度神經網絡的3D中重建工作,實際上並不是重建,而是圖像分類。深度學習並不是萬能的!深度學習並不是萬靈藥。近幾年,隨著深度學習的大熱,許多研究攻克了如何從單張圖片生成3D模型。從某些方面似乎再次驗證了深度學習的神奇——doing almost the impossible。