計算機視覺/圖像處理學術速遞[10.08]

2021-01-18 arXiv每日學術速遞

點擊藍字↑關注公眾號，如有幫助，點個「在看」哦

cs.CV 方向，今日共計56篇

[檢測分類相關]：

【1】 Learning Monocular 3D Vehicle Detection without 3D Bounding Box Labels

作者： L. Koestler, D. Cremers

連結：https://arxiv.org/abs/2010.03506

【2】 Deep Learning in Diabetic Foot Ulcers Detection: A Comprehensive Evaluation

作者： Moi Hoon Yap, Eibe Frank

連結：https://arxiv.org/abs/2010.03341

【3】 Multi-label classification of promotions in digital leaflets using textual and visual information

標題:使用文本和視覺信息對數字傳單中的促銷進行多標籤分類

作者： Roberto Arroyo, Javier Martínez-Cebrián

備註：Conference on Computational Linguistics (COLING). Workshop on Natural Language Processing in E-Commerce (EcomNLP 2020)

連結：https://arxiv.org/abs/2010.03331

【4】 YOdar: Uncertainty-based Sensor Fusion for Vehicle Detection with Camera and Radar Sensors

標題:YODAR：基於不確定性的相機和雷達車輛檢測傳感器融合

作者： Kamil Kowol, Hanno Gottschalk

連結：https://arxiv.org/abs/2010.03320

【5】 Attention Model Enhanced Network for Classification of Breast Cancer Image

作者： Xiao Kang, Yilong Yin

連結：https://arxiv.org/abs/2010.03271

【6】 Learning Binary Semantic Embedding for Histology Image Classification and Retrieval

作者： Xiao Kang, Yilong Yin

連結：https://arxiv.org/abs/2010.03266

【7】 SLCRF: Subspace Learning with Conditional Random Field for Hyperspectral Image Classification

標題:SLCRF：基於條件隨機場的子空間學習在高光譜圖像分類中的應用

作者： Yun Cao, Yibo Zheng

連結：https://arxiv.org/abs/2010.03115

【8】 Global Self-Attention Networks for Image Recognition

作者： Zhuoran Shen, Ching-Hui Chen

連結：https://arxiv.org/abs/2010.03019

【9】 Online Action Detection in Streaming Videos with Time Buffers

作者： Bowen Zhang, Yuanjun Xiong

連結：https://arxiv.org/abs/2010.03016

【10】 A Fast and Effective Method of Macula Automatic Detection for Retina Images

作者： Yukang Jiang, Yan Luo

連結：https://arxiv.org/abs/2010.03122

[分割/語義相關]：

【1】 BoMuDA: Boundless Multi-Source Domain Adaptive Segmentation in Unconstrained Environments

標題:BoMuDA：無約束環境下的無界多源域自適應分割

作者： Divya Kothandaraman, Dinesh Manocha

連結：https://arxiv.org/abs/2010.03523

【2】 Using Sentences as Semantic Representations in Large Scale Zero-Shot Learning

作者： Yannick Le Cacheux, Michel Crucianu

連結：https://arxiv.org/abs/2010.02959

[人臉相關]：

【1】 A Novel Face-tracking Mouth Controller and its Application to Interacting with Bioacoustic Models

標題:一種新的人臉跟蹤口控制器及其相互作用與Bioacoustic模型中的應用

作者： Gamhewage C. de Silva, Michael J. Lyons

備註：Proceedings of the International Conference on New Interfaces for Musical Expression, 2004 (NIME-04)

連結：https://arxiv.org/abs/2010.03265

【2】 Sonification of Facial Actions for Musical Expression

作者： Mathias Funk, Michael J. Lyons

備註：Proceedings of the International Conference on New Interfaces for Musical Expression, 2005 (NIME-05)

連結：https://arxiv.org/abs/2010.03223

【3】 Designing, Playing, and Performing with a Vision-based Mouth Interface

作者： Michael J. Lyons, Nobuji Tetsutani

備註：Proceedings of the International Conference on New Interfaces for Musical Expression, 2003

連結：https://arxiv.org/abs/2010.03213

[GAN/對抗式/生成式相關]：

【1】 On the Evaluation of Generative Adversarial Networks By Discriminative Models

作者： Amirsina Torfi, Edward A. Fox

備註：Accepted to be published in ICPR 2020

連結：https://arxiv.org/abs/2010.03549

【2】 CD-UAP: Class Discriminative Universal Adversarial Perturbation

作者： Chaoning Zhang, In So Kweon

連結：https://arxiv.org/abs/2010.03300

【3】 DML-GANR: Deep Metric Learning With Generative Adversarial Network Regularization for High Spatial Resolution Remote Sensing Image Retrieval

標題:DML-GANR：用於高空間解析度遙感圖像檢索的產生式對抗性網絡正則化深度度量學習

作者： Yun Cao, Lihua Li

連結：https://arxiv.org/abs/2010.03116

【4】 Adversarial Patch Attacks on Monocular Depth Estimation Networks

作者： Koichiro Yamanaka, Toshiaki Fujii

連結：https://arxiv.org/abs/2010.03072

【5】 Memory-efficient GAN-based Domain Translation of High Resolution 3D Medical Images

標題:基於GAN的高解析度三維醫學圖像的內存高效域轉換

作者： Hristina Uzunova, Heinz Handels

連結：https://arxiv.org/abs/2010.03396

【6】 Batch Normalization Increases Adversarial Vulnerability: Disentangling Usefulness and Robustness of Model Features

標題:批量歸一化增加敵方脆弱性：模型特徵的分離、有用性和健壯性

作者： Philipp Benz, In So Kweon

連結：https://arxiv.org/abs/2010.03316

【7】 Double Targeted Universal Adversarial Perturbations

作者： Philipp Benz, In So Kweon

備註：Accepted at ACCV 2020

連結：https://arxiv.org/abs/2010.03288

[圖像/視頻檢索]：

【1】 Channel Recurrent Attention Networks for Video Pedestrian Retrieval

作者： Pengfei Fang, Mehrtash Harandi

備註：To appear in ACCV 2020

連結：https://arxiv.org/abs/2010.03108

[行為/時空/光流/姿態/運動]：

【1】 Motion Prediction Using Temporal Inception Module

作者： Tim Lebailly, Wei Wang

備註：16 pages, 4 figures. To appear in the proceedings of the 15th Asian Conference on Computer Vision, ACCV 2020

連結：https://arxiv.org/abs/2010.03006

[半/弱/無監督相關]：

【1】 Weakly-Supervised Feature Learning via Text and Image Matching

作者： Gongbo Liang, Nathan Jacobs

連結：https://arxiv.org/abs/2010.03060

[跟蹤相關]：

【1】 A deep learning pipeline for identification of motor units in musculoskeletal ultrasound

作者： Hazrat Ali, Christer Grönlund

連結：https://arxiv.org/abs/2010.03028

【2】 Real-Time Resource Allocation for Tracking Systems

作者： Yash Satsangi, Henri Bouma

連結：https://arxiv.org/abs/2010.03024

[遷移學習/domain/主動學習/自適應]：

【1】 Variational Transfer Learning for Fine-grained Few-shot Visual Recognition

作者： Jingyi Xu, Dimitris Samaras

連結：https://arxiv.org/abs/2010.03255

【2】 Domain Adaptive Transfer Learning on Visual Attention Aware Data Augmentation for Fine-grained Visual Categorization

標題:基於視覺注意感知數據增強的域自適應遷移學習在細粒度視覺分類中的應用

作者： Ashiq Imran, Vassilis Athitsos

連結：https://arxiv.org/abs/2010.03071

[超解析度]：

【1】 WDN: A Wide and Deep Network to Divide-and-Conquer Image Super-resolution

作者： Vikram Singh (1), Anurag Mittal (1) ((1) Indian Institute of Technology - Madras)

連結：https://arxiv.org/abs/2010.03199

[3D/3D重建等相關]：

【1】 Rotation-Invariant Local-to-Global Representation Learning for 3D Point Cloud

作者： Seohyun Kim, Bohyung Han

備註：15 pages, Accepted by NeurIPS 2020

連結：https://arxiv.org/abs/2010.03318

【2】 Secure 3D medical Imaging

作者： Shadi Al-Zu'bi

連結：https://arxiv.org/abs/2010.03367

[其他視頻相關]：

【1】 Reconfigurable Cyber-Physical System for Lifestyle Video-Monitoring via Deep Learning

標題:基於深度學習的可重構生活方式視頻監控網絡物理系統

作者： Daniel Deniz, Eduardo Ros

連結：https://arxiv.org/abs/2010.03497

【2】 Predicting Hourly Demand in Station-free Bike-sharing Systems with Video-level Data

標題:利用視頻級數據預測無站共享單車系統的小時需求量

作者： Xiao Yan, Xianghua Gan

連結：https://arxiv.org/abs/2010.03027

[其他]：

【1】 High-Capacity Expert Binary Networks

作者： Adrian Bulat, Georgios Tzimiropoulos

連結：https://arxiv.org/abs/2010.03558

【2】 Super-Human Performance in Online Low-latency Recognition of Conversational Speech

作者： Thai-Son Nguyen, Alex Waibel

連結：https://arxiv.org/abs/2010.03449

【3】 Universal Weighting Metric Learning for Cross-Modal Matching

作者： Jiwei Wei, Heng Tao Shen

連結：https://arxiv.org/abs/2010.03403

【4】 A study on using image based machine learning methods to develop the surrogate models of stamp forming simulations

標題:基於圖像的機器學習方法開發衝壓成形仿真代理模型的研究

作者： Haosu Zhou, Nan Li

連結：https://arxiv.org/abs/2010.03370

【5】 Contour Primitive of Interest Extraction Network Based on One-shot Learning for Object-Agnostic Vision Measurement

標題:基於單次學習的物體不可知視覺測量感興趣提取網絡輪廓基元

作者： Fangbo Qin, De Xu

連結：https://arxiv.org/abs/2010.03325

【6】 Learning Clusterable Visual Features for Zero-Shot Recognition

作者： Jingyi Xu, Dimitris Samaras

連結：https://arxiv.org/abs/2010.03245

【7】 RealSmileNet: A Deep End-To-End Network for Spontaneous and Posed Smile Recognition

標題:RealSmileNet：一種用於自發和姿勢微笑識別的深度端到端網絡

作者： Yan Yang, Shafin Rahman

連結：https://arxiv.org/abs/2010.03203

【8】 Vision-Based Object Recognition in Indoor Environments Using Topologically Persistent Features

標題:基於拓撲持久化特徵的室內環境下基於視覺的目標識別

作者： Ekta U. Samani, Ashis G. Banerjee

連結：https://arxiv.org/abs/2010.03196

【9】 VICTR: Visual Information Captured Text Representation for Text-to-Image Multimodal Tasks

標題:VICTR：用於文本到圖像多模式任務的視覺信息捕獲文本表示

作者： Caren Han, Josiah Poon

備註：Accepted by COLING 2020

連結：https://arxiv.org/abs/2010.03182

【10】 A Study on Trees's Knots Prediction from their Bark Outer-Shape

作者： Mejri Mohamed, Cedric Pradalier

備註：arXiv admin note: text overlap with arXiv:2002.04571

連結：https://arxiv.org/abs/2010.03173

【11】 Rotate to Attend: Convolutional Triplet Attention Module

作者： Diganta Misra, Qibin Hou

連結：https://arxiv.org/abs/2010.03045

【12】 Place Recognition in Forests with Urquhart Tessellations

作者： Guilherme V. Nardari, Vijay Kumar

連結：https://arxiv.org/abs/2010.03026

【13】 IS-CAM: Integrated Score-CAM for axiomatic-based explanations

標題:IS-CAM：基於公理解釋的集成SCORE-CAM

作者： Rakshit Naidu, Soumya Snigdha Kundu

連結：https://arxiv.org/abs/2010.03023

【14】 Learning to Represent Image and Text with Denotation Graph

作者： Bowen Zhang, Fei Sha

備註：to appear at EMNLP 2020

連結：https://arxiv.org/abs/2010.02949

【15】 Gradient Flow in Sparse Neural Networks and How Lottery Tickets Win

作者： Utku Evci, Yann Dauphin

連結：https://arxiv.org/abs/2010.03533

【16】 Discriminative Cross-Modal Data Augmentation for Medical Imaging Applications

作者： Yue Yang, Pengtao Xie

連結：https://arxiv.org/abs/2010.03468

【17】 Deep Neural Network: An Efficient and Optimized Machine Learning Paradigm for Reducing Genome Sequencing Error

標題:深度神經網絡：一種降低基因組測序誤差的高效優化機器學習範式

作者： Ferdinand Kartriku, Charles Saah

連結：https://arxiv.org/abs/2010.03420

【18】 Descriptive analysis of computational methods for automating mammograms with practical applications

標題:乳房X線片自動化計算方法的描述性分析及實際應用

作者： Aparna Bhale, Manish Joshi

連結：https://arxiv.org/abs/2010.03378

【19】 Low-Rank Robust Online Distance/Similarity Learning based on the Rescaled Hinge Loss

標題:基於調整鉸鏈損耗的低秩魯棒在線距離/相似學習

作者： Davood Zabihzadeh, Ali Karami-Mollaee

連結：https://arxiv.org/abs/2010.03268

【20】 Deep Learning-Based Grading of Ductal Carcinoma In Situ in Breast Histopathology Images

標題:基於深度學習的乳腺組織病理學圖像導管原位癌分級

作者： Suzanne C. Wetstein, Mitko Veta

連結：https://arxiv.org/abs/2010.03244

【21】 M3Lung-Sys: A Deep Learning System for Multi-Class Lung Pneumonia Screening from CT Imaging

標題:基於CT影像的多類肺肺炎篩查深度學習系統M3LUNG-Sys

作者： Xuelin Qian, Xiangyang Xue

備註：IEEE Journal of Biomedical and Health Informatics (JBHI), 2020

連結：https://arxiv.org/abs/2010.03201

【22】 Conditional Generative Modeling via Learning the Latent Space

作者： Sameera Ramasinghe, Stephen Gould

連結：https://arxiv.org/abs/2010.03132

機器翻譯，僅供參考

計算機視覺/圖像處理學術速遞[10.08]

相關焦點

計算機視覺/圖像處理學術速遞[08.03]

計算機視覺/圖像處理學術速遞[02.03]

計算機視覺/圖像處理學術速遞[08.20]

計算機視覺/圖像處理學術速遞[08.06]

計算機視覺/圖像處理學術速遞[12.14]

計算機視覺/圖像處理學術速遞[11.03]

計算機視覺/圖像處理學術速遞[12.18]

計算機視覺將用來處理相機圖像

計算機視覺和圖像處理之間有什麼區別?

計算機視覺(圖像)技術:視覺圖像搜索綜述

【期刊速遞】高光譜遙感圖像處理與信息提取直播預告

包括的領域有計算機視覺,語音識別,自然語言處理,圖像識別等

機器視覺和智能圖像處理技術之間的關係

智能圖像處理讓機器視覺及其應用更智能高效

計算機視覺 vs 機器視覺

人工智慧與計算機視覺

EI會議:圖像、視覺與智能系統國際會議( ICIVIS2021)

視覺感知-從人類視覺到計算機視覺

計算機視覺領域的王者與榮耀丨CCF-GAIR 2018

10 大深度學習架構:計算機視覺優秀從業者必備(附代碼實現)

計算機視覺/圖像處理學術速遞[10.08]

相關焦點

計算機視覺/圖像處理學術速遞[08.03]

計算機視覺/圖像處理學術速遞[02.03]

計算機視覺/圖像處理學術速遞[08.20]

計算機視覺/圖像處理學術速遞[08.06]

計算機視覺/圖像處理學術速遞[12.14]

計算機視覺/圖像處理學術速遞[11.03]

計算機視覺/圖像處理學術速遞[12.18]

計算機視覺將用來處理相機圖像

計算機視覺和圖像處理之間有什麼區別?

計算機視覺(圖像)技術:視覺圖像搜索綜述

【期刊速遞】高光譜遙感圖像處理與信息提取直播預告

包括的領域有計算機視覺,語音識別,自然語言處理,圖像識別等

機器視覺和智能圖像處理技術之間的關係

智能圖像處理 讓機器視覺及其應用更智能高效

計算機視覺 vs 機器視覺

人工智慧與計算機視覺

EI會議:圖像、視覺與智能系統國際會議( ICIVIS2021)

視覺感知-從人類視覺到計算機視覺

計算機視覺領域的王者與榮耀丨CCF-GAIR 2018

10 大深度學習架構:計算機視覺優秀從業者必備(附代碼實現)

智能圖像處理讓機器視覺及其應用更智能高效