25篇最新CV領域綜述性論文速遞!涵蓋15個方向:目標檢測/圖像處理/姿態估計/醫學影像/人臉識別等方向

2022-01-04 極市平臺

收錄於話題 #視覺綜述 2個

加入極市專業CV交流群,與 10000+來自港科大、北大、清華、中科院、CMU、騰訊、百度 等名校名企視覺開發者互動交流!

同時提供每月大咖直播分享、真實項目需求對接、乾貨資訊匯總,行業技術交流。關注 極市平臺 公眾號 ,回復 加群,立刻申請入群~

目標檢測標題:Deep Domain Adaptive Object Detection: a Survey連結:https://arxiv.org/abs/2002.06797本文共梳理了40篇相關文獻,由中科院自動化所學者發布。基於深度學習(DL)的目標檢測已經取得了很大的進展,這些方法通常假設有大量的帶標籤的訓練數據可用,並且訓練和測試數據從相同的分布中提取。然而,這兩個假設在實踐中並不總是成立的。深域自適應目標檢測(DDAOD)作為一種新的學習範式應運而生。本文綜述了深域自適應目標檢測方法的研究進展。標題:Anomalous Instance Detection in Deep Learning: A Survey作者:Saikiran Bulusu, Dawn Song連結:https://arxiv.org/abs/2003.06979本文共梳理了119篇相關文獻,由雪城大學學者發布。討論多種異常實例檢測方法,並分析了各種方法的相對優勢和劣勢。標題:Moving Objects Detection with a Moving Camera: A Comprehensive Review作者:Marie-Neige Chapel, Thierry Bouwmans連結:https://arxiv.org/abs/2001.05238本文共梳理了347篇相關文獻。隨著移動傳感器的興起,研究移動相機逐漸變為熱門方向。本文對不同現有方法進行了識別,並將其分為一個平面或多個兩類。在這兩個類別中,將各類方法分為8:全景背景減法,雙攝像頭,運動補償,子空間分割,運動分割,平面+視差,多平面和按塊分割圖像。本文還對公開可用的數據集和評估指標進行了研究。圖像分類
4. 圖像分類中的半監督,自我監督和無監督技術綜述標題:A survey on Semi-,  Self- and Unsupervised Techniques in Image Classification
作者:Lars Schmarje, Reinhard Koch連結:https://arxiv.org/abs/2002.08721本文共梳理了51篇相關文獻。綜述了標籤較少的圖像分類中常用的21種技術和方法。我們比較方法,並確定了三個主要趨勢。圖像去噪標題:Deep Learning on Image Denoising: An overview作者:Chunwei Tian, Chia-Wen Lin連結:https://arxiv.org/abs/1912.13171本文梳理了238篇相關文獻,由哈爾濱工業大學、廣東工業大學、清華大學學者共同發布。不同類型的處理噪聲深度學習方法存在巨大差異,而目前很少有相關研究來進行相關總結。本文對圖像去噪中不同深度學習技術進行了比較研究,分析不同方法的動機和原理,並在公共去噪數據集進行比較。研究包括:(1). 加白噪聲圖像的CNN;(2)用於真實噪聲圖像的CNN;(3)用於盲噪聲去噪的CNN;(4)用於混合噪聲圖像的CNN。圖像分割標題:Image Segmentation Using Deep Learning: A Survey作者:Shervin Minaee, Demetri Terzopoulos連結:https://arxiv.org/abs/2001.05566本文梳理了172篇相關文獻,對語義和實例分割文獻進行了全面回顧,涵蓋了的各種開創性作品,包括全卷積像素標記網絡,編碼器-解碼器體系結構,多尺度以及基於金字塔的方法,遞歸網絡,視覺注意模型以及對抗中的生成模型。人臉識別標題:DeepFakes and Beyond: A Survey of Face Manipulation and Fake Detection作者:Ruben Tolosana, Javier Ortega-Garcia

連結:https://arxiv.org/abs/2001.00179

本文梳理了105篇相關文獻,本文對操縱人臉的圖像技術(包括DeepFake方法)以及檢測此類技術的方法進行了全面綜述。論述了四種類型的面部操作:全臉合成、面部身份交換(DeepFakes)、面部屬性操作以及面部表情操作。

姿態估計8. 目標姿態回顧:從3D邊界框檢測器到完整的6D姿態估計器標題:A Review on Object Pose Recovery: from 3D Bounding Box Detectors to Full 6D Pose Estimators作者:Caner Sahin, Tae-Kyun Kim連結:https://arxiv.org/abs/2001.10609本文梳理了206篇相關文獻,由倫敦帝國理工學院學者發布。本文對3D邊界框檢測器到完整的6D姿態估計器的物體姿態恢復方法的進行了首次全面的綜述。基於數學模型,將各類方法分為分類,回歸,分類與回歸,模板匹配和點對特徵匹配任務。行為/動作識別
9. 基於3D骨架的動作識別學習方法的研究標題:A Survey on 3D Skeleton-Based Action Recognition Using Learning Method連結:https://arxiv.org/abs/2002.05907
本文梳理了81篇相關文獻,由北京大學學者發布。本文強調了動作識別的必要性和3D骨架數據的重要性,然後以數據驅動的方式對基於遞歸神經網絡,基於卷積神經網絡和基於圖卷積網絡的主流動作識別技術進行了全面介紹,這也是第一次對使用3D骨架數據進行基於深度學習的動作識別的全面研究。人群計數標題:CNN-based Density Estimation and Crowd Counting: A Survey作者:Guangshuai Gao, Yunhong Wang連結:https://arxiv.org/abs/2003.12783本文梳理了222篇相關文獻,由北京航空航天大學學者發布,基於CNN的密度圖估計方法,調研了220+工作,對人群計數進行了全面系統的研究。同時根據評估指標,在人群統計數據集上選擇表現最好的三名,並分析其優缺點。醫學影像11. 使用經典和深層神經網絡進行的乳房組織病理學圖像分析的全面綜述標題:A Comprehensive Review for Breast Histopathology Image Analysis Using  Classical and Deep Neural Networks作者:Xiaomin Zhou,  Tao Jiang連結:https://arxiv.org/abs/2003.12255本文梳理了180篇相關文獻,由東北大學學者發布。對基於人工神經網絡的BHIA技術進行了全面概述,將BHIA系統分為經典和深度神經網絡以進行深入研究,分析現有模型以發現最合適的算法,並提供可公開訪問的數據集。標題:Medical Image Registration Using Deep Neural Networks: A Comprehensive Review作者:Hamid Reza Boveiri, Ali Reza MehdiZadeh連結:https://arxiv.org/abs/2002.03401本文梳理了117篇相關文獻,對使用深度神經網絡進行醫學圖像配準的最新文獻進行了全面回顧,系統地涵蓋了該領域的相關作品,包括關鍵概念,統計分析,關鍵技術,主要貢獻,挑戰和未來方向。13. 邁向自動威脅檢測:X射線安全成像中深度學習進展綜述標題:Towards Automatic Threat Detection: A Survey of Advances of Deep Learning within X-ray Security Imaging作者:Samet Akcay, Toby Breckon連結:https://arxiv.org/abs/2001.01293本文梳理了151篇相關文獻,由英國杜倫大學學者發布。本文分常規機器學習和當代深度學習兩類來回顧X射線安全成像算法。將深度學習方法分為有監督,半監督和無監督學習,著重論述分類,檢測,分割和異常檢測任務,同時包含有完善的X射線數據集。
標題:Deep neural network models for computational histopathology: A survey作者:Chetan L. Srinidhi, Anne L. Martel連結:https://arxiv.org/abs/1912.12378本文梳理了130篇相關文獻,由多倫多大學學者發布。本文對組織病理學圖像分析中使用的最新深度學習方法進行了全面回顧,包括有監督,弱監督,無監督,遷移學習等領域,並總結了幾個現有的開放數據集。三維重建標題:A Survey On 3D Inner Structure Prediction from its Outer Shape作者:Mohamed Mejri, Cédric Pradalier連結:https://arxiv.org/abs/2002.04571本文梳理了81篇相關文獻,由北京大學學者發布。由於過去與骨架數據相關內容很少,本文是第一篇針對使用3D骨架數據進行基於深度學習的動作識別進行全面討論的研究。本文突出了動作識別和3D骨架數據的重要性,以數據驅動的方式對基於遞歸神經網絡、卷積神經網絡和圖卷積網絡的主流動作識別技術進行了全面介紹。並介紹了最大的3D骨架數據集NTU-RGB+D及其新版本NTU-RGB+D 120,並論述了幾種現有的頂級算法。三維點雲標題:Target-less registration of point clouds: A review本文對48篇文獻進行了梳理,總結了無目標點雲配準的基本工作,回顧了三種常用的配準方法,即基於特徵匹配的方法,迭代最近點算法和隨機假設,並分析了這些方法的優缺點,介紹它們的常見應用場景。連結:https://arxiv.org/abs/1912.12756OCR:17. 手寫光學字符識別(OCR):綜合系統文獻綜述(SLR)標題:Handwritten Optical Character Recognition (OCR): A Comprehensive Systematic Literature Review (SLR)作者:Jamshed Memon, Rizwan Ahmed Khan連結:https://arxiv.org/abs/2001.00139本文對142篇相關文獻進行了梳理,總結了有關OCR的研究,綜述了2000年至2018年之間發布的研究文章,介紹OCR的最新結果和技術,並分析研究差距,以總結研究方向。深度depth相關:標題:Monocular Depth Estimation Based On Deep Learning: An Overview作者:Chaoqiang Zhao, Feng Qian連結:https://arxiv.org/abs/2003.06620
本文對119篇相關文獻進行了梳理,由華東理工大學學者發布。隨著深度神經網絡的迅速發展,基於深度學習的單眼深度估計已得到廣泛研究。為了提高深度估計的準確性,提出了各種網絡框架,損失函數和訓練策略。因此,本文綜述了當前基於深度學習的單眼深度估計方法,總結了幾種基於深度學習的深度估計中廣泛使用的數據集和評價指標,同時根據不同的訓練方式回顧了一些有代表性的現有方法:有監督,無監督和半監督。CNN標題:A Survey of Convolutional Neural Networks: Analysis, Applications, and Prospects作者:Zewen Li, Wenjie Yang, Shouheng Peng, Fan Liu連結:https://arxiv.org/abs/2004.02806本文對119篇相關文獻進行了梳理,由華東理工大學學者發布。本文旨在在卷積神經網絡這個快速增長的領域中儘可能提供新穎的想法和前景,不僅涉及二維卷積,而且涉及一維和多維卷積。首先,本文簡要介紹了CNN的歷史並概述了CNN發展,介紹經典CNN模型,重點論述使它們達到SOTA的關鍵因素,並通過實驗分析提供了一些經驗法則,最後對一維,二維和多維卷積的應用進行了概述。視覺常識/其他標題:On Information Plane Analyses of Neural Network Classifiers -- A Review連結:https://arxiv.org/abs/2003.09671標題:A Survey of Methods for Low-Power Deep Learning and Computer Vision作者:Abhinav Goel, George K. Thiruvathukal連結:https://arxiv.org/abs/2003.1106622. 深度學習遇到數據對齊時:深度註冊網絡(DRN)評述標題:When Deep Learning Meets Data Alignment: A Review on Deep Registration Networks (DRNs)作者:Victor Villena-Martinez, Robert B. Fisher連結:https://arxiv.org/abs/2003.03167標題:Towards Unconstrained Palmprint Recognition on Consumer Devices: a Literature Review作者:Adrian-S. Ungureanu, Peter Corcoran連結:https://arxiv.org/abs/2003.00737標題:Features for Ground Texture Based Localization -- A Survey作者:Jan Fabian Schmid,  Rudolf Mester連結:https://arxiv.org/abs/2002.1194825. 從觀看到移動:視覺室內導航(VIN)學習綜述標題:From Seeing to Moving: A Survey on Learning for Visual Indoor Navigation (VIN)連結:https://arxiv.org/abs/2002.11310為了方便大家閱讀,小極已經將上述論文全部打包下載。在 極市平臺 公眾號後臺回復 25綜述 ,即可獲取打包下載連結。40萬獎金的AI移動應用大賽,參賽就有獎,入圍還有額外獎勵

添加極市小助手微信(ID : cv-mart),備註:研究方向-姓名-學校/公司-城市(如:目標檢測-小極-北大-深圳),即可申請加入目標檢測、目標跟蹤、人臉、工業檢測、醫學影像、三維&SLAM、圖像分割等極市技術交流群,更有每月大咖直播分享、真實項目需求對接、求職內推、算法競賽、乾貨資訊匯總、行業技術交流,一起來讓思想之光照的更遠吧~

△長按添加極市小助手

△長按關注極市平臺,獲取最新CV乾貨

覺得有用麻煩給個在看啦~  

相關焦點

  • 25篇最新CV領域綜述性論文速遞(附下載)!涵蓋15個方向:目標檢測/圖像處理/姿態估計/醫學影像/人臉識別等方向
    25篇CV領域最新的綜述性論文,涵蓋目標檢測、圖像分類、圖像去噪、圖像分割、人臉識別、姿態估計、醫學影像等15個方向,文末提供這25篇論文打包好的下載途徑。基於深度學習(DL)的目標檢測已經取得了很大的進展,這些方法通常假設有大量的帶標籤的訓練數據可用,並且訓練和測試數據從相同的分布中提取。然而,這兩個假設在實踐中並不總是成立的。深域自適應目標檢測(DDAOD)作為一種新的學習範式應運而生。本文綜述了深域自適應目標檢測方法的研究進展。
  • 騰訊優圖8篇論文入選,涵蓋目標跟蹤、行人重識別、人臉識別等領域
    近日,計算機視覺方向的三大國際頂級會議之一的ECCV 2020公布論文獲獎結果。本次ECCV 2020有效投稿5025篇,最終被接受發表論文1361篇,錄取率為27%,較上屆有所下降。
  • 計算機視覺方向簡介 | 人體姿態估計
    近年來,研究人員提出了多種人體姿態估計方法,其中最早(也是最慢)的方法通常是在只有一個人的圖像中估計一個人的姿勢。這些方法通常先識別出各個部件,然後通過在它們之間形成連接來創建姿勢。 當然,如果是在包含多人的現實場景,這些方法就不是很有用了。
  • ECCV 2020 | 騰訊優圖8篇論文入選,涵蓋目標跟蹤、行人重識別...
    近日,計算機視覺方向的三大國際頂級會議之一的ECCV 2020公布論文獲獎結果。本次ECCV 2020有效投稿5025篇,最終被接受發表論文1361篇,錄取率為27%,較上屆有所下降。在競爭越來越激烈的情況下,本次ECCV 騰訊優圖實驗室共入選8篇論文,涵蓋目標跟蹤、行人重識別、人臉識別、人體姿態估計、動作識別、物體檢測等熱門及前沿領域,再次展示了騰訊在計算機視覺領域的科研及創新實力。
  • Facebook等提出實時3D人臉姿態估計新方法,代碼已開源!
    基於二者的兩步走方法是很多人臉推理任務的關鍵所在,如 3D 重建。這種方法的處理過程通常可以表述為:首先執行人臉檢測,然後在每個檢測到的人臉邊界框中執行關鍵點檢測。接下來,將檢測到的關鍵點與參考 2D 圖像或 3D 模型上對應的理想位置進行匹配,然後使用標準方法求解對齊變換。因此,「人臉對齊」和「關鍵點檢測」這兩個術語有時可以互換使用。
  • 騰訊優圖11篇論文入選,涵蓋動作識別、人群密度估計、人臉安全等領域
    近日,國際人工智慧頂級會議AAAI 2021公布了論文錄取結果。AAAI是人工智慧領域最悠久、涵蓋內容最為廣泛的國際頂級學術會議之一。AAAI 2021一共收到9034篇論文提交,其中有效審稿的數量為7911篇,最終錄取數量為1692篇,錄取率為21.4%。
  • 跳過人臉檢測和關鍵點定位,Facebook等提出實時3D人臉姿態估計新方法
    因此,「人臉對齊」和「關鍵點檢測」這兩個術語有時可以互換使用。這種方法應用起來非常成功,但計算成本很高,尤其是那些 SOTA 模型。而且,關鍵點檢測器通常針對由特定人臉檢測器生成的邊界框特性進行優化,因此一旦人臉檢測器更新,關鍵點檢測器就需要重新進行優化。最後,在下圖 1 所示的密集人臉圖像場景中,準確定位標準的 68 個人臉關鍵點會變得非常困難,進而加大了估計其姿態和人臉對齊的難度。
  • 對話頂會、解讀最佳:CVPR 2020最佳論文對CV領域的啟發
    CVPR 2020已落下帷幕,共計投稿6656篇,錄用1470篇,涵蓋的方向包括目標檢測、目標跟蹤、圖像分割、人臉識別、姿態估計、三維點雲、視頻分析、模型加速、GAN、OCR等。
  • 騰訊優圖11篇論文入選,涵蓋動作識別、人群密度估計、人臉安全等...
    近日,國際人工智慧頂級會議AAAI 2021公布了論文錄取結果。AAAI是人工智慧領域最悠久、涵蓋內容最為廣泛的國際頂級學術會議之一。AAAI 2021一共收到9034篇論文提交,其中有效審稿的數量為7911篇,最終錄取數量為1692篇,錄取率為21.4%。
  • WACV 2021 論文大盤點-姿態估計篇
    本篇繼續總結姿態估計相關論文, 3D 的佔大多數,有 3D 姿勢、形狀估計,還有 3D 手部姿勢估計。還有人臉姿態估計、跨物種姿態估計等。
  • 人臉識別最全知識圖譜
    數字圖像檢索管理、醫學影像分析、智能安檢、人機互動等領域都有計算機視覺技術的涉足。該技術是人工智慧技術的重要組成部分,也是當今計算機科學研究的前沿領域。經過近年的不斷發展,已逐步形成一套以數位訊號處理技術、計算機圖形圖像、資訊理論和語義學相互結合的綜合性技術,並具有較強的邊緣性和學科交叉性。
  • 40個姿態估計優秀開源項目匯總
    本文收集了40個姿態估計開源項目,包括AlphaPose、GluonCV、HyperPose等人體姿勢估計庫,並對其進行了簡要介紹。https://github.com/MVIG-SJTU/AlphaPosehttps://github.com/dmlc/gluon-cv使用Tensorflow和自定義架構實現深度姿勢估計,以進行快速推理。已經使用Tensorflow實現了「 Openpose」人體姿勢估計算法。它還提供了幾種變體,這些變體對網絡結構進行了一些更改,以便在CPU或低功耗嵌入式設備上進行實時處理。
  • WACV 2021 論文大盤點-人臉技術篇
    本篇內容是 2021 年第一篇整理類文章,也是今年 CV 領域第一個較有影響力的學術會議
  • 顏水成、黃亮等新論文;目標檢測最新SOTA;NLP全面綜述
    機器之心整理 參與:一鳴、杜偉 本周論文有:顏水成團隊的「PSGAN 一鍵上妝」,黃亮團隊在同傳任務的集束搜索上進行了一些改進,同時還有 NLP 相關綜述、目標檢測最新 SOTA 成果、數字在詞嵌入中的處理研究等。
  • 無需人臉檢測,即可實時,6自由度3維人臉姿態估計方法 | 代碼剛開源
    摘要我們提出了實時、六自由度(6DoF)、三維人臉姿態估計,無需人臉檢測或關鍵點定位。我們發現估計人臉的6自由度剛性變換比人臉關鍵點檢測更簡單,人臉關鍵點檢測通常用於三維人臉對齊。此外,6DoF提供了比人臉框標籤更多的信息。
  • 四篇入選oral,深睿醫療8篇科研論文被國際學術會議IEEE CVPR、ISBI...
    近日,深睿醫療8篇最新科研成果被全球計算機視覺與模式識別會議(IEEE CVPR 2020)以及IEEE生物醫學成像國際研討會(IEEE ISBI 2020)收錄,其中4篇為oral,這些論文代表了計算機視覺領域尤其是醫療影像方向國際前沿的科研進展
  • 今日Paper | 依賴性解析器;DNNs對圖像損壞;高效人臉特徵學習...
    為了解決這個問題,這篇論文證明了一個簡單但經過適當調優的加性高斯噪聲和散斑噪聲訓練,就可以很好地將模型推廣到看不見的圖像幹擾上,從而在ImageNet-C和MNIST-C數據集上達到最新的性能表現。基於這些結果,這篇論文認為在不相關的噪聲分布上對識別模型進行對抗訓練,可以進一步提高模型性能。
  • 解讀騰訊優圖ICCV2017 12篇論文:全球首個AI卸妝效果的算法等
    今年,即將於2017年11月8日在北京國家會議中心舉辦的AI World 2017世界人工智慧大會上,我們請到了騰訊優圖實驗室傑出科學家賈佳亞教授發表演講。 想了解更多關於騰訊優圖和計算機視覺的前沿動態?點擊文末閱讀原文,馬上參會!
  • 硬核科普人臉識別,讓你看的清清楚楚明明白白
    這裡面我們要著重講的是模式識別,它是一個獨立的理論體系,具體到計算機視覺領域的應用,它表示將計算機表示出來的圖像和一致的類別進行匹配的過程。有點懂是吧。IT之家為大家通俗解釋一下,所謂「識別」,就是先認識,然後辨別。認識什麼?認識的是圖像和從圖像中總結的目標物體的特徵。怎麼辨別?就是將總結出來的特徵和自己已經掌握的特徵庫進行比對,然後才能實現辨別。
  • 人臉識別:AI產品經理需要了解的CV通識
    最近整理了CV方向的一些產品基礎知識,我的上一篇文章《看AI產品經理如何介紹「計算機視覺」(基於實戰經驗和案例)》算是這個系列的第一篇;本文是本系列下的第二篇,主要針對人臉識別進行梳理。後續還會有多目標跟蹤、OCR等方向的內容。希望大家能從這個系列收穫到更多的CV乾貨:)人臉識別(Face Recognition):對圖像中的人臉進行檢測、識別和跟蹤。