計算機視覺/圖像處理學術速遞[10.08]

2021-01-18 arXiv每日學術速遞

點擊藍字↑關注公眾號,如有幫助, 點個「在看」哦

cs.CV 方向,今日共計56篇

[檢測分類相關]:

【1】 Learning Monocular 3D Vehicle Detection without 3D Bounding Box Labels

作者: L. Koestler, D. Cremers

連結:https://arxiv.org/abs/2010.03506

【2】 Deep Learning in Diabetic Foot Ulcers Detection: A Comprehensive Evaluation

作者: Moi Hoon Yap, Eibe Frank

連結:https://arxiv.org/abs/2010.03341

【3】 Multi-label classification of promotions in digital leaflets using textual and visual information

標題:使用文本和視覺信息對數字傳單中的促銷進行多標籤分類

作者: Roberto Arroyo, Javier Martínez-Cebrián

備註:Conference on Computational Linguistics (COLING). Workshop on Natural Language Processing in E-Commerce (EcomNLP 2020)

連結:https://arxiv.org/abs/2010.03331

【4】 YOdar: Uncertainty-based Sensor Fusion for Vehicle Detection with Camera and Radar Sensors

標題:YODAR:基於不確定性的相機和雷達車輛檢測傳感器融合

作者: Kamil Kowol, Hanno Gottschalk

連結:https://arxiv.org/abs/2010.03320

【5】 Attention Model Enhanced Network for Classification of Breast Cancer Image

作者: Xiao Kang, Yilong Yin

連結:https://arxiv.org/abs/2010.03271

【6】 Learning Binary Semantic Embedding for Histology Image Classification and Retrieval

作者: Xiao Kang, Yilong Yin

連結:https://arxiv.org/abs/2010.03266

【7】 SLCRF: Subspace Learning with Conditional Random Field for Hyperspectral Image Classification

標題:SLCRF:基於條件隨機場的子空間學習在高光譜圖像分類中的應用

作者: Yun Cao, Yibo Zheng

連結:https://arxiv.org/abs/2010.03115

【8】 Global Self-Attention Networks for Image Recognition

作者: Zhuoran Shen, Ching-Hui Chen

連結:https://arxiv.org/abs/2010.03019

【9】 Online Action Detection in Streaming Videos with Time Buffers

作者: Bowen Zhang, Yuanjun Xiong

連結:https://arxiv.org/abs/2010.03016

【10】 A Fast and Effective Method of Macula Automatic Detection for Retina Images

作者: Yukang Jiang, Yan Luo

連結:https://arxiv.org/abs/2010.03122

[分割/語義相關]:

【1】 BoMuDA: Boundless Multi-Source Domain Adaptive Segmentation in Unconstrained Environments

標題:BoMuDA:無約束環境下的無界多源域自適應分割

作者: Divya Kothandaraman, Dinesh Manocha

連結:https://arxiv.org/abs/2010.03523

【2】 Using Sentences as Semantic Representations in Large Scale Zero-Shot Learning

作者: Yannick Le Cacheux, Michel Crucianu

連結:https://arxiv.org/abs/2010.02959

[人臉相關]:

【1】 A Novel Face-tracking Mouth Controller and its Application to Interacting with Bioacoustic Models

標題:一種新的人臉跟蹤口控制器及其相互作用與Bioacoustic模型中的應用

作者: Gamhewage C. de Silva, Michael J. Lyons

備註:Proceedings of the International Conference on New Interfaces for Musical Expression, 2004 (NIME-04)

連結:https://arxiv.org/abs/2010.03265

【2】 Sonification of Facial Actions for Musical Expression

作者: Mathias Funk, Michael J. Lyons

備註:Proceedings of the International Conference on New Interfaces for Musical Expression, 2005 (NIME-05)

連結:https://arxiv.org/abs/2010.03223

【3】 Designing, Playing, and Performing with a Vision-based Mouth Interface

作者: Michael J. Lyons, Nobuji Tetsutani

備註:Proceedings of the International Conference on New Interfaces for Musical Expression, 2003

連結:https://arxiv.org/abs/2010.03213

[GAN/對抗式/生成式相關]:

【1】 On the Evaluation of Generative Adversarial Networks By Discriminative Models

作者: Amirsina Torfi, Edward A. Fox

備註:Accepted to be published in ICPR 2020

連結:https://arxiv.org/abs/2010.03549

【2】 CD-UAP: Class Discriminative Universal Adversarial Perturbation

作者: Chaoning Zhang, In So Kweon

連結:https://arxiv.org/abs/2010.03300

【3】 DML-GANR: Deep Metric Learning With Generative Adversarial Network Regularization for High Spatial Resolution Remote Sensing Image Retrieval

標題:DML-GANR:用於高空間解析度遙感圖像檢索的產生式對抗性網絡正則化深度度量學習

作者: Yun Cao, Lihua Li

連結:https://arxiv.org/abs/2010.03116

【4】 Adversarial Patch Attacks on Monocular Depth Estimation Networks

作者: Koichiro Yamanaka, Toshiaki Fujii

連結:https://arxiv.org/abs/2010.03072

【5】 Memory-efficient GAN-based Domain Translation of High Resolution 3D Medical Images

標題:基於GAN的高解析度三維醫學圖像的內存高效域轉換

作者: Hristina Uzunova, Heinz Handels

連結:https://arxiv.org/abs/2010.03396

【6】 Batch Normalization Increases Adversarial Vulnerability: Disentangling Usefulness and Robustness of Model Features

標題:批量歸一化增加敵方脆弱性:模型特徵的分離、有用性和健壯性

作者: Philipp Benz, In So Kweon

連結:https://arxiv.org/abs/2010.03316

【7】 Double Targeted Universal Adversarial Perturbations

作者: Philipp Benz, In So Kweon

備註:Accepted at ACCV 2020

連結:https://arxiv.org/abs/2010.03288

[圖像/視頻檢索]:

【1】 Channel Recurrent Attention Networks for Video Pedestrian Retrieval

作者: Pengfei Fang, Mehrtash Harandi

備註:To appear in ACCV 2020

連結:https://arxiv.org/abs/2010.03108

[行為/時空/光流/姿態/運動]:

【1】 Motion Prediction Using Temporal Inception Module

作者: Tim Lebailly, Wei Wang

備註:16 pages, 4 figures. To appear in the proceedings of the 15th Asian Conference on Computer Vision, ACCV 2020

連結:https://arxiv.org/abs/2010.03006

[半/弱/無監督相關]:

【1】 Weakly-Supervised Feature Learning via Text and Image Matching

作者: Gongbo Liang, Nathan Jacobs

連結:https://arxiv.org/abs/2010.03060

[跟蹤相關]:

【1】 A deep learning pipeline for identification of motor units in musculoskeletal ultrasound

作者: Hazrat Ali, Christer Grönlund

連結:https://arxiv.org/abs/2010.03028

【2】 Real-Time Resource Allocation for Tracking Systems

作者: Yash Satsangi, Henri Bouma

連結:https://arxiv.org/abs/2010.03024

[遷移學習/domain/主動學習/自適應]:

【1】 Variational Transfer Learning for Fine-grained Few-shot Visual Recognition

作者: Jingyi Xu, Dimitris Samaras

連結:https://arxiv.org/abs/2010.03255

【2】 Domain Adaptive Transfer Learning on Visual Attention Aware Data Augmentation for Fine-grained Visual Categorization

標題:基於視覺注意感知數據增強的域自適應遷移學習在細粒度視覺分類中的應用

作者: Ashiq Imran, Vassilis Athitsos

連結:https://arxiv.org/abs/2010.03071

[超解析度]:

【1】 WDN: A Wide and Deep Network to Divide-and-Conquer Image Super-resolution

作者: Vikram Singh (1), Anurag Mittal (1) ((1) Indian Institute of Technology - Madras)

連結:https://arxiv.org/abs/2010.03199

[3D/3D重建等相關]:

【1】 Rotation-Invariant Local-to-Global Representation Learning for 3D Point Cloud

作者: Seohyun Kim, Bohyung Han

備註:15 pages, Accepted by NeurIPS 2020

連結:https://arxiv.org/abs/2010.03318

【2】 Secure 3D medical Imaging

作者: Shadi Al-Zu'bi

連結:https://arxiv.org/abs/2010.03367

[其他視頻相關]:

【1】 Reconfigurable Cyber-Physical System for Lifestyle Video-Monitoring via Deep Learning

標題:基於深度學習的可重構生活方式視頻監控網絡物理系統

作者: Daniel Deniz, Eduardo Ros

連結:https://arxiv.org/abs/2010.03497

【2】 Predicting Hourly Demand in Station-free Bike-sharing Systems with Video-level Data

標題:利用視頻級數據預測無站共享單車系統的小時需求量

作者: Xiao Yan, Xianghua Gan

連結:https://arxiv.org/abs/2010.03027

[其他]:

【1】 High-Capacity Expert Binary Networks

作者: Adrian Bulat, Georgios Tzimiropoulos

連結:https://arxiv.org/abs/2010.03558

【2】 Super-Human Performance in Online Low-latency Recognition of Conversational Speech

作者: Thai-Son Nguyen, Alex Waibel

連結:https://arxiv.org/abs/2010.03449

【3】 Universal Weighting Metric Learning for Cross-Modal Matching

作者: Jiwei Wei, Heng Tao Shen

連結:https://arxiv.org/abs/2010.03403

【4】 A study on using image based machine learning methods to develop the surrogate models of stamp forming simulations

標題:基於圖像的機器學習方法開發衝壓成形仿真代理模型的研究

作者: Haosu Zhou, Nan Li

連結:https://arxiv.org/abs/2010.03370

【5】 Contour Primitive of Interest Extraction Network Based on One-shot Learning for Object-Agnostic Vision Measurement

標題:基於單次學習的物體不可知視覺測量感興趣提取網絡輪廓基元

作者: Fangbo Qin, De Xu

連結:https://arxiv.org/abs/2010.03325

【6】 Learning Clusterable Visual Features for Zero-Shot Recognition

作者: Jingyi Xu, Dimitris Samaras

連結:https://arxiv.org/abs/2010.03245

【7】 RealSmileNet: A Deep End-To-End Network for Spontaneous and Posed Smile Recognition

標題:RealSmileNet:一種用於自發和姿勢微笑識別的深度端到端網絡

作者: Yan Yang, Shafin Rahman

連結:https://arxiv.org/abs/2010.03203

【8】 Vision-Based Object Recognition in Indoor Environments Using Topologically Persistent Features

標題:基於拓撲持久化特徵的室內環境下基於視覺的目標識別

作者: Ekta U. Samani, Ashis G. Banerjee

連結:https://arxiv.org/abs/2010.03196

【9】 VICTR: Visual Information Captured Text Representation for Text-to-Image Multimodal Tasks

標題:VICTR:用於文本到圖像多模式任務的視覺信息捕獲文本表示

作者: Caren Han, Josiah Poon

備註:Accepted by COLING 2020

連結:https://arxiv.org/abs/2010.03182

【10】 A Study on Trees's Knots Prediction from their Bark Outer-Shape

作者: Mejri Mohamed, Cedric Pradalier

備註:arXiv admin note: text overlap with arXiv:2002.04571

連結:https://arxiv.org/abs/2010.03173

【11】 Rotate to Attend: Convolutional Triplet Attention Module

作者: Diganta Misra, Qibin Hou

連結:https://arxiv.org/abs/2010.03045

【12】 Place Recognition in Forests with Urquhart Tessellations

作者: Guilherme V. Nardari, Vijay Kumar

連結:https://arxiv.org/abs/2010.03026

【13】 IS-CAM: Integrated Score-CAM for axiomatic-based explanations

標題:IS-CAM:基於公理解釋的集成SCORE-CAM

作者: Rakshit Naidu, Soumya Snigdha Kundu

連結:https://arxiv.org/abs/2010.03023

【14】 Learning to Represent Image and Text with Denotation Graph

作者: Bowen Zhang, Fei Sha

備註:to appear at EMNLP 2020

連結:https://arxiv.org/abs/2010.02949

【15】 Gradient Flow in Sparse Neural Networks and How Lottery Tickets Win

作者: Utku Evci, Yann Dauphin

連結:https://arxiv.org/abs/2010.03533

【16】 Discriminative Cross-Modal Data Augmentation for Medical Imaging Applications

作者: Yue Yang, Pengtao Xie

連結:https://arxiv.org/abs/2010.03468

【17】 Deep Neural Network: An Efficient and Optimized Machine Learning Paradigm for Reducing Genome Sequencing Error

標題:深度神經網絡:一種降低基因組測序誤差的高效優化機器學習範式

作者: Ferdinand Kartriku, Charles Saah

連結:https://arxiv.org/abs/2010.03420

【18】 Descriptive analysis of computational methods for automating mammograms with practical applications

標題:乳房X線片自動化計算方法的描述性分析及實際應用

作者: Aparna Bhale, Manish Joshi

連結:https://arxiv.org/abs/2010.03378

【19】 Low-Rank Robust Online Distance/Similarity Learning based on the Rescaled Hinge Loss

標題:基於調整鉸鏈損耗的低秩魯棒在線距離/相似學習

作者: Davood Zabihzadeh, Ali Karami-Mollaee

連結:https://arxiv.org/abs/2010.03268

【20】 Deep Learning-Based Grading of Ductal Carcinoma In Situ in Breast Histopathology Images

標題:基於深度學習的乳腺組織病理學圖像導管原位癌分級

作者: Suzanne C. Wetstein, Mitko Veta

連結:https://arxiv.org/abs/2010.03244

【21】 M3Lung-Sys: A Deep Learning System for Multi-Class Lung Pneumonia Screening from CT Imaging

標題:基於CT影像的多類肺肺炎篩查深度學習系統M3LUNG-Sys

作者: Xuelin Qian, Xiangyang Xue

備註:IEEE Journal of Biomedical and Health Informatics (JBHI), 2020

連結:https://arxiv.org/abs/2010.03201

【22】 Conditional Generative Modeling via Learning the Latent Space

作者: Sameera Ramasinghe, Stephen Gould

連結:https://arxiv.org/abs/2010.03132

機器翻譯,僅供參考

相關焦點

  • 計算機視覺/圖像處理學術速遞[08.03]
    //arxiv.org/abs/2007.15818【4】 Weakly supervised one-stage vision and language disease detection using large scale pneumonia and pneumothorax studies標題:使用大規模肺炎和氣胸研究的弱監督一期視覺和語言疾病檢測
  • 計算機視覺/圖像處理學術速遞[02.03]
    Benedetta Tondi,Yao Zhao,Rongrong Ni,Mauro Barni連結:https://arxiv.org/abs/2102.01439【9】 Child-Computer Interaction: Recent Works, New Dataset, and Age Detection標題:兒童-計算機交互
  • 計算機視覺/圖像處理學術速遞[08.20]
    Possibility of Contextual Camouflage Attack on Object Detection標題:CCA:探索上下文偽裝攻擊在目標檢測中的可能性作者: Shengnan Hu, Hassan Foroosh 連結:https://arxiv.org/abs/2008.08281【10
  • 計算機視覺/圖像處理學術速遞[08.06]
    2020連結:https://arxiv.org/abs/2008.01860【3】 Structure Preserving Stain Normalization of Histopathology Images Using Self-Supervised Semantic Guidance標題:基於自監督語義引導的組織病理圖像結構保持染色歸一化
  • 計算機視覺/圖像處理學術速遞[12.14]
    July 15th, 2020連結:https://arxiv.org/abs/2012.06136【7】 Color-related Local Binary Pattern: A Learned Local Descriptor for Color  Image Recognition標題:顏色相關局部二值模式:一種用於彩色圖像識別的學習型局部描述子
  • 計算機視覺/圖像處理學術速遞[11.03]
    audio-visual event classification and localization標題:AVECL-UMONS視聽事件分類和定位資料庫作者: Mathilde Brousmiche, Jean Rouat 連結:https://arxiv.org/abs/2011.01018【10
  • 計算機視覺/圖像處理學術速遞[12.18]
    >標題:基於卷積神經網絡的槍枝檢測:語義分割模型與端到端解決方案的比較作者:Alexander Egiazarov,Fabio Massimo Zennaro,Vasileios Mavroeidis機構:Digital Security Group, University of Oslo, Oslo, Norway備註:10
  • 計算機視覺將用來處理相機圖像
    得到一些數據以及判斷,然後推斷應該怎麼工作,這其中包括對人的數據進行分析,包括性別,年齡,籍貫等等,也包括對機器的運算發送指令給人工,使用代碼來進行循環.然後在人工智慧的背後,一個重要的單位就是計算機視覺,它們主要負責識別,分類,檢測,填充,分割.首先計算機視覺可以幫助我們更好的了解自己的眼睛,也就是我們的眼睛,視覺的作用在於生物可以更好的了解周圍的世界。
  • 計算機視覺和圖像處理之間有什麼區別?
    現代機器視覺系統背後的的核心動機在於模擬人類視覺,用於識別圖案,面部以及將將2D圖像轉化為3D模型等。在概念層面,圖像處理和計算機視覺之間存在很多重疊,並且經常被誤解的術語可以互換使用。在這裡,我們簡要概述了這些技術,並解釋了它們在基礎層面上的不同之處。
  • 計算機視覺(圖像)技術:視覺圖像搜索綜述
    首先,OpenCV是一個開源的計算機視覺處理庫,在計算機視覺、圖像處理和模式識別中有廣泛的應用。接口安全易用,而且跨平臺做的相當不錯,是一個不可多得的計算機圖像及視覺處理庫。  其次,Python的語法更加易用,貼近自然語言,極為靈活。
  • 【期刊速遞】高光譜遙感圖像處理與信息提取直播預告
    高光譜圖像處理與信息提取技術是高光譜遙感領域的核心研究內容之一。隨著智能化信息分析和高性能硬體處理技術的發展,高光譜遙感衛星系統也將步入智能化時代。如何利用人工智慧等最新成果,發展高光譜圖像處理與信息提取的高性能實時處理技術?如何發揮高光譜遙感的優勢和特點,發展新理論和新方法?
  • 包括的領域有計算機視覺,語音識別,自然語言處理,圖像識別等
    現在人工智慧已經包括的領域有計算機視覺,語音識別,自然語言處理,圖像識別等。人工智慧的步驟人工智慧基本步驟包括,信息提取->信息分析->假設建模->學習->泛化,具體步驟。如果說計算機視覺是讓計算機看到一張黑白的二維圖像,那麼它可以識別字符串,可以通過圖像獲取某個標註的信息,它具有特定的識別圖像,可以從圖像分析出某個基本的結構。
  • 機器視覺和智能圖像處理技術之間的關係
    一般認為機器視覺「是通過光學裝置和非接觸傳感器自動地接受和處理一個真實場景的圖像,通過分析圖像獲得所需信息或用於控制機器運動的裝置」,可以看出智能圖像處理技術在機器視覺中佔有舉足輕重的位置。 智能圖像處理是指一類基於計算機的自適應於各種應用場合的圖像處理和分析技術,本身是一個獨立的理論和技術領域,但同時又是機器視覺中的一項十分重要的技術支撐。
  • 智能圖像處理 讓機器視覺及其應用更智能高效
    編者按:無論是「中國製造2025」還是「工業4.0」都離不開人工智慧,離不開計算機視覺,而智能圖像處理是機器視覺的核心技術,隨著圖像處理水平的不斷提高,一定會有力地推動機器視覺的迅速發展。
  • 計算機視覺 vs 機器視覺
    計算機視覺和機器視覺通常被認為是同一個行業,其實它們是重疊技術的不同術語。計算機視覺廣義上是指圖像分析的捕獲和自動化,並著重於在廣泛的理論和實際應用中的圖像分析功能。傳統上,機器視覺是借鑑參考了計算機視覺技術,在某些工業或實際應用中根據視覺系統完成圖像分析的某些功能或結果。視覺系統使用軟體來識別預編程的功能,該系統可根據發現結果觸發各種設定的「動作」。例如,在食品和飲料行業的裝瓶廠中,視覺系統可用於識別多個物體。它可以驗證空瓶本身沒有損壞和異物。
  • 人工智慧與計算機視覺
    計算機視覺是使用計算機及相關設備對生物視覺的一種模擬,是人工智慧領域的一個重要部分,它的研究目標是使計算機具有通過二維圖像認知三維環境信息的能力。計算機視覺是以圖象處理技術、信號處理技術、概率統計分析、計算幾何、神經網絡、機器學習理論和計算機信息處理技術等為基礎,通過計算機分析與處理視覺信息。
  • EI會議:圖像、視覺與智能系統國際會議( ICIVIS2021)
    圖像、視覺與智能系統國際會議(International Conference on Image, Vision and Intelligent Systems)(ICIVIS)現已啟動徵稿。我們將共同討論圖像、視覺和智能系統及相關研究領域的學術趨勢和發展趨勢,討論當前的熱點問題,分享研究成果,促進相關研究和應用的發展和進展,促進學科發展,促進人才培養。會議完全開放註冊,提交的內容將根據原創性,與會議的相關性進行同行評審,演示。ICIVIS會議論文集將由IOP出版,並將提交EI,Scopus等核心索引。
  • 視覺感知-從人類視覺到計算機視覺
    1.4億個神經元組成,是大腦中最神秘的部分之一,負責處理和解釋視覺數據以提供感知力並建立記憶。例如給定一幅圖像,我們可以利用上下文和先驗知識得知整個故事。 但是,使計算機感知視覺世界有多困難?截至2019年,我們才取得了一定進展,但依舊還有很長的路要走。計算機視覺是計算機科學的一個相對較新的領域,大約有60年的歷史。
  • 計算機視覺領域的王者與榮耀丨CCF-GAIR 2018
    在這背後,安防視頻監控與醫療影像,也成為眾多AI從業者尤為青睞的兩大行業。當計算機視覺研究與落地大潮湧動之際,第三屆CCF-GAIR全球人工智慧與機器人峰會「計算機視覺專場」,眾多科技巨頭首席技術官、獨角獸首席科學家、國際學術頂會主席、世界名校AI實驗室主任將會公開分享最前沿的計算機視覺技術研究與商用成果。
  • 10 大深度學習架構:計算機視覺優秀從業者必備(附代碼實現)
    原標題:10 大深度學習架構:計算機視覺優秀從業者必備(附代碼實現) 選自Analytics Vidhya 作者:FAIZAN SHAIKH 的文章,總結了計算機視覺領域已經成效卓著的 10 個深度學習架構,並附上了每篇論文的地址連結和代碼實現。機器之心對該文進行了編譯,原文連結請見文末。 時刻跟上深度學習領域的最新進展變的越來越難,幾乎每一天都有創新或新應用。但是,大多數進展隱藏在大量發表的 ArXiv / Springer 研究論文中。