收錄於話題 #視覺綜述 2個
加入極市專業CV交流群,與 10000+來自港科大、北大、清華、中科院、CMU、騰訊、百度 等名校名企視覺開發者互動交流!
同時提供每月大咖直播分享、真實項目需求對接、乾貨資訊匯總,行業技術交流。關注 極市平臺 公眾號 ,回復 加群,立刻申請入群~
目標檢測
標題:Deep Domain Adaptive Object Detection: a Survey連結:https://arxiv.org/abs/2002.06797本文共梳理了
40篇相關文獻,由
中科院自動化所學者發布。基於深度學習(DL)的目標檢測已經取得了很大的進展,這些方法通常假設有大量的帶標籤的訓練數據可用,並且訓練和測試數據從相同的分布中提取。然而,這兩個假設在實踐中並不總是成立的。深域自適應目標檢測(DDAOD)作為一種新的學習範式應運而生。本文綜述了深域自適應目標檢測方法的研究進展。
標題:Anomalous Instance Detection in Deep Learning: A Survey作者:Saikiran Bulusu, Dawn Song連結:https://arxiv.org/abs/2003.06979本文共梳理了
119篇相關文獻,由
雪城大學學者發布。討論多種異常實例檢測方法,並分析了各種方法的相對優勢和劣勢。
標題:Moving Objects Detection with a Moving Camera: A Comprehensive Review作者:Marie-Neige Chapel, Thierry Bouwmans連結:https://arxiv.org/abs/2001.05238本文共梳理了
347篇相關文獻。隨著移動傳感器的興起,研究移動相機逐漸變為熱門方向。本文對不同現有方法進行了識別,並將其分為一個平面或多個兩類。在這兩個類別中,將各類方法分為
8組:全景背景減法,雙攝像頭,運動補償,子空間分割,運動分割,平面+視差,多平面和按塊分割圖像。本文還對公開可用的數據集和評估指標進行了研究。圖像分類
4. 圖像分類中的半監督,自我監督和無監督技術綜述標題:A survey on Semi-, Self- and Unsupervised Techniques in Image Classification作者:Lars Schmarje, Reinhard Koch連結:https://arxiv.org/abs/2002.08721本文共梳理了
51篇相關文獻。綜述了標籤較少的圖像分類中常用的
21種技術和方法。我們比較方法,並確定了三個主要趨勢。圖像去噪
標題:Deep Learning on Image Denoising: An overview作者:Chunwei Tian, Chia-Wen Lin連結:https://arxiv.org/abs/1912.13171本文梳理了
238篇相關文獻,由
哈爾濱工業大學、廣東工業大學、清華大學學者共同發布。不同類型的處理噪聲深度學習方法存在巨大差異,而目前很少有相關研究來進行相關總結。本文對圖像去噪中不同深度學習技術進行了比較研究,分析不同方法的動機和原理,並在公共去噪數據集進行比較。研究包括:(1). 加白噪聲圖像的CNN;(2)用於真實噪聲圖像的CNN;(3)用於盲噪聲去噪的CNN;(4)用於混合噪聲圖像的CNN。圖像分割
標題:Image Segmentation Using Deep Learning: A Survey作者:Shervin Minaee, Demetri Terzopoulos連結:https://arxiv.org/abs/2001.05566本文梳理了
172篇相關文獻,對語義和實例分割文獻進行了全面回顧,涵蓋了的各種開創性作品,包括全卷積像素標記網絡,編碼器-解碼器體系結構,多尺度以及基於金字塔的方法,遞歸網絡,視覺注意模型以及對抗中的生成模型。人臉識別
標題:DeepFakes and Beyond: A Survey of Face Manipulation and Fake Detection作者:Ruben Tolosana, Javier Ortega-Garcia
連結:https://arxiv.org/abs/2001.00179
本文梳理了105篇相關文獻,本文對操縱人臉的圖像技術(包括DeepFake方法)以及檢測此類技術的方法進行了全面綜述。論述了四種類型的面部操作:全臉合成、面部身份交換(DeepFakes)、面部屬性操作以及面部表情操作。
姿態估計
8. 目標姿態回顧:從3D邊界框檢測器到完整的6D姿態估計器標題:A Review on Object Pose Recovery: from 3D Bounding Box Detectors to Full 6D Pose Estimators作者:Caner Sahin, Tae-Kyun Kim連結:https://arxiv.org/abs/2001.10609本文梳理了
206篇相關文獻,由
倫敦帝國理工學院學者發布。本文對3D邊界框檢測器到完整的6D姿態估計器的物體姿態恢復方法的進行了首次全面的綜述。基於數學模型,將各類方法分為分類,回歸,分類與回歸,模板匹配和點對特徵匹配任務。行為/動作識別
9. 基於3D骨架的動作識別學習方法的研究標題:A Survey on 3D Skeleton-Based Action Recognition Using Learning Method連結:https://arxiv.org/abs/2002.05907
本文梳理了
81篇相關文獻,由
北京大學學者發布。本文強調了動作識別的必要性和3D骨架數據的重要性,然後以數據驅動的方式對基於遞歸神經網絡,基於卷積神經網絡和基於圖卷積網絡的主流動作識別技術進行了全面介紹,這也是第一次對使用3D骨架數據進行基於深度學習的動作識別的全面研究。人群計數
標題:CNN-based Density Estimation and Crowd Counting: A Survey作者:Guangshuai Gao, Yunhong Wang連結:https://arxiv.org/abs/2003.12783本文梳理了
222篇相關文獻,由
北京航空航天大學學者發布,基於CNN的密度圖估計方法,調研了
220+工作,對人群計數進行了全面系統的研究。同時根據評估指標,在人群統計數據集上選擇表現最好的三名,並分析其優缺點。醫學影像
11. 使用經典和深層神經網絡進行的乳房組織病理學圖像分析的全面綜述標題:A Comprehensive Review for Breast Histopathology Image Analysis Using Classical and Deep Neural Networks作者:Xiaomin Zhou, Tao Jiang連結:https://arxiv.org/abs/2003.12255本文梳理了
180篇相關文獻,由
東北大學學者發布。對基於人工神經網絡的BHIA技術進行了全面概述,將BHIA系統分為經典和深度神經網絡以進行深入研究,分析現有模型以發現最合適的算法,並提供可公開訪問的數據集。
標題:Medical Image Registration Using Deep Neural Networks: A Comprehensive Review作者:Hamid Reza Boveiri, Ali Reza MehdiZadeh連結:https://arxiv.org/abs/2002.03401本文梳理了
117篇相關文獻,對使用深度神經網絡進行醫學圖像配準的最新文獻進行了全面回顧,系統地涵蓋了該領域的相關作品,包括關鍵概念,統計分析,關鍵技術,主要貢獻,挑戰和未來方向。
13. 邁向自動威脅檢測:X射線安全成像中深度學習進展綜述標題:Towards Automatic Threat Detection: A Survey of Advances of Deep Learning within X-ray Security Imaging作者:Samet Akcay, Toby Breckon連結:https://arxiv.org/abs/2001.01293本文梳理了
151篇相關文獻,由
英國杜倫大學學者發布。本文分常規機器學習和當代深度學習兩類來回顧X射線安全成像算法。將深度學習方法分為有監督,半監督和無監督學習,著重論述分類,檢測,分割和異常檢測任務,同時包含有完善的X射線數據集。
標題:Deep neural network models for computational histopathology: A survey作者:Chetan L. Srinidhi, Anne L. Martel連結:https://arxiv.org/abs/1912.12378本文梳理了
130篇相關文獻,由
多倫多大學學者發布。本文對組織病理學圖像分析中使用的最新深度學習方法進行了全面回顧,包括有監督,弱監督,無監督,遷移學習等領域,並總結了幾個現有的開放數據集。三維重建
標題:A Survey On 3D Inner Structure Prediction from its Outer Shape作者:Mohamed Mejri, Cédric Pradalier連結:https://arxiv.org/abs/2002.04571本文梳理了
81篇相關文獻,由
北京大學學者發布。由於過去與骨架數據相關內容很少,本文是第一篇針對使用3D骨架數據進行基於深度學習的動作識別進行全面討論的研究。本文突出了動作識別和3D骨架數據的重要性,以數據驅動的方式對基於遞歸神經網絡、卷積神經網絡和圖卷積網絡的主流動作識別技術進行了全面介紹。並介紹了最大的3D骨架數據集NTU-RGB+D及其新版本NTU-RGB+D 120,並論述了幾種現有的頂級算法。三維點雲
標題:Target-less registration of point clouds: A review本文對
48篇文獻進行了梳理,總結了無目標點雲配準的基本工作,回顧了三種常用的配準方法,即基於特徵匹配的方法,迭代最近點算法和隨機假設,並分析了這些方法的優缺點,介紹它們的常見應用場景。連結:https://arxiv.org/abs/1912.12756OCR:
17. 手寫光學字符識別(OCR):綜合系統文獻綜述(SLR)標題:Handwritten Optical Character Recognition (OCR): A Comprehensive Systematic Literature Review (SLR)作者:Jamshed Memon, Rizwan Ahmed Khan連結:https://arxiv.org/abs/2001.00139本文對
142篇相關文獻進行了梳理,總結了有關OCR的研究,綜述了2000年至2018年之間發布的研究文章,介紹OCR的最新結果和技術,並分析研究差距,以總結研究方向。深度depth相關:
標題:Monocular Depth Estimation Based On Deep Learning: An Overview作者:Chaoqiang Zhao, Feng Qian連結:https://arxiv.org/abs/2003.06620
本文對
119篇相關文獻進行了梳理,由
華東理工大學學者發布。隨著深度神經網絡的迅速發展,基於深度學習的單眼深度估計已得到廣泛研究。為了提高深度估計的準確性,提出了各種網絡框架,損失函數和訓練策略。因此,本文綜述了當前基於深度學習的單眼深度估計方法,總結了幾種基於深度學習的深度估計中廣泛使用的數據集和評價指標,同時根據不同的訓練方式回顧了一些有代表性的現有方法:有監督,無監督和半監督。CNN
標題:A Survey of Convolutional Neural Networks: Analysis, Applications, and Prospects作者:Zewen Li, Wenjie Yang, Shouheng Peng, Fan Liu連結:https://arxiv.org/abs/2004.02806本文對
119篇相關文獻進行了梳理,由
華東理工大學學者發布。本文旨在在卷積神經網絡這個快速增長的領域中儘可能提供新穎的想法和前景,不僅涉及二維卷積,而且涉及一維和多維卷積。首先,本文簡要介紹了CNN的歷史並概述了CNN發展,介紹經典CNN模型,重點論述使它們達到SOTA的關鍵因素,並通過實驗分析提供了一些經驗法則,最後對一維,二維和多維卷積的應用進行了概述。視覺常識/其他
標題:On Information Plane Analyses of Neural Network Classifiers -- A Review連結:https://arxiv.org/abs/2003.09671
標題:A Survey of Methods for Low-Power Deep Learning and Computer Vision作者:Abhinav Goel, George K. Thiruvathukal連結:https://arxiv.org/abs/2003.11066
22. 深度學習遇到數據對齊時:深度註冊網絡(DRN)評述標題:When Deep Learning Meets Data Alignment: A Review on Deep Registration Networks (DRNs)作者:Victor Villena-Martinez, Robert B. Fisher連結:https://arxiv.org/abs/2003.03167
標題:Towards Unconstrained Palmprint Recognition on Consumer Devices: a Literature Review作者:Adrian-S. Ungureanu, Peter Corcoran連結:https://arxiv.org/abs/2003.00737
標題:Features for Ground Texture Based Localization -- A Survey作者:Jan Fabian Schmid, Rudolf Mester連結:https://arxiv.org/abs/2002.11948
25. 從觀看到移動:視覺室內導航(VIN)學習綜述標題:From Seeing to Moving: A Survey on Learning for Visual Indoor Navigation (VIN)連結:https://arxiv.org/abs/2002.11310為了方便大家閱讀,小極已經將上述論文全部打包下載。在
極市平臺 公眾號後臺回復
25綜述 ,即可獲取打包下載連結。
40萬獎金的AI移動應用大賽,參賽就有獎,入圍還有額外獎勵添加極市小助手微信
(ID : cv-mart),備註:
研究方向-姓名-學校/公司-城市(如:目標檢測-小極-北大-深圳),即可申請加入
目標檢測、目標跟蹤、人臉、工業檢測、醫學影像、三維&SLAM、圖像分割等極市技術交流群,更有
每月大咖直播分享、真實項目需求對接、求職內推、算法競賽、乾貨資訊匯總、行業技術交流,一起來讓思想之光照的更遠吧~
△長按添加極市小助手
△長按關注極市平臺,獲取最新CV乾貨
覺得有用麻煩給個在看啦~