計算機視覺中的深度學習專題(2020) |《中國科學:信息科學》英文版

2021-02-19 中國科學雜誌社
深度學習技術在許多研究領域都取得了巨大的成功, 尤其在計算機視覺領域取得了顯著的進展. SCIENCE CHINA Information Sciences從2019 年起持續組織出版「Special Focus on Deep Learning for Computer Vision" (計算機視覺中的深度學習專題), 旨在報導利用深度學習解決重要視覺任務的新思路.

該專題第二批共錄用了6篇論文和4篇短文, 涵蓋了語義分割、目標檢測、圖像合成、文本識別、年齡估計等有挑戰性的重要視覺任務, 發表於 SCIENCE CHINA Information Sciences 2020年63卷第2期, 歡迎閱讀!

Progressive rectification network for irregular text recognition

Yunze GAO, Yingying CHEN*, Jinqiao WANG & Hanqing LU

專題論文|PRN:面向不規則文字識別的漸進矯正網絡

提出了一種漸進式矯正網絡, 可將不規則形狀的文本迭代轉換為水平排列的規則視圖, 從而顯著提升了文本識別的精度. 

Ordinal distribution regression for gait-based age estimation

Haiping ZHU, Yuheng ZHANG, Guohao LI, Junping ZHANG* & Hongming SHAN

通過嘗試將年齡的順序關係作為一個重要線索, 設計了一種新的序數分布損失函數, 能有效用於基於步態的年齡估計. 該方法具有一定的通用性, 同樣適用於基於人臉的年齡估計. 

FACLSTM: ConvLSTM with focused attention for scene text recognition

Qingqing WANG, Ye HUANG, Wenjing JIA, Xiangjian HE, Michael BLUMENSTEIN, Shujing LYU & Yue LU*

論文介紹|面向場景文本識別的帶聚焦注意力機制的convLSTM

提出了一種命名為ConvLSTM文本識別模型, 能夠從二維空間直接識別場景文本. 在此基礎之上, 該方法引入了注意力機制和字符中心位置來進一步對文本識別精度進行了提升. 

CGNet: cross-guidance network for semantic segmentation

Zhijie ZHANG & Yanwei PANG*

提出了一個新的網絡框架CGNet, 能夠同時進行語義分割、邊緣檢測和顯著性檢測三種視覺任務. 在邊緣檢測與顯著性檢測子網絡的引導下, CGNet的語義分割性能能獲得顯著提升.

SynthText3D: synthesizing scene text images from 3D virtual worlds

Minghui LIAO, Boyu SONG, Shangbang LONG, Minghang HE, Cong YAO & Xiang BAI*

提出了一種通過三維虛擬世界產生場景文本圖像的特別思路. 通過三維虛擬環境產生的文本圖像數據具有理想的視覺效果, 涵蓋了透視變換、光照與遮擋等多種變化, 可用於訓練更魯棒的文本檢測模型.

Preserving details in semantics-aware context for scene parsing

Shuai MA, Yanwei PANG*, Jing PAN & Ling SHAO

相關焦點

  • 近存/存內計算專題 |《中國科學:信息科學》英文版
    收錄於話題 #《中國科學:信息科學》 28個
  • 微納米力學專題 |《中國科學:技術科學》英文版
    2021年1月,SCIENCE CHINA Technological Sciences,SCTS(《中國科學:技術科學》英文版)出版了
  • 《中國科學: 信息科學》(英文版) 2017年第9期概覽
    ↑點擊上方「中國科學信息科學」, 及時獲取期刊動態!
  • 「悟空」衛星首個觀測結果英文專題出版 |《中國科學: 物理學 力學 天文學》英文版
    2017年11月,我國暗物質粒子探測衛星「悟空」(Dark Matter Particle Explorer,DAMPE)發布了首個科學成果
  • ...和周煦之團隊研究成果被選為《中國科學:技術科學》英文版封面...
    北京大學地球與空間科學學院空間物理與應用技術研究所長江學者宗秋剛教授團隊與青年千人周煦之研究員團隊揭示地球磁層超低頻波演化特性的研究成果,近日作為封面文章刊登於《中國科學:技術科學》英文版Science China Technological Sciences,文章題目為「Ultralow frequency wave characteristics extracted
  • 《科學通報》英文版最新出版「幹細胞基礎研究與應用」專題
    最新一期《科學通報》英文版(Science Bulletin)刊登了由中科院上海生命科學研究院生物化學與細胞研究所
  • 深度學習—計算機視覺學習路線【從學術到工作】
    甚至連生物醫學、機械自動化、土木建築等諸多專業的學生都開始研究其在各自領域的應用,一個視覺交流群裡三分之一以上都不是計算機相關專業的。當然,我也是其中一員。對於非計算機相關專業的同學而言,學習過程中往往缺少交流機會,不容易把握視覺知識的全貌。這裡僅根據個人經驗和網絡知識,談一談對於一名非計算機專業的學生而言,該不該入門計算機視覺?以及該如何學習計算機視覺?
  • 深度學習與計算機視覺 看這一篇就夠了
    前深度學習時代的計算機視覺  網際網路巨頭看重深度學習當然不是為了學術,主要是它能帶來巨大的市場。那為什麼在深度學習出來之前,傳統算法為什麼沒有達到深度學習的精度?  在深度學習算法出來之前,對於視覺算法來說,大致可以分為以下5個步驟:特徵感知,圖像預處理,特徵提取,特徵篩選,推理預測與識別。
  • 機器學習和深度學習學習資料專題二
    介紹:這本書是由谷歌公司和MIT共同出品的計算機科學中的數學:Mathematics for Computer Science,Eric Lehman et al 2013 。3)計數,求和,生成函數。4)概率,隨機行走。5)遞歸。等等介紹:資訊時代的計算機科學理論,目前國內有紙質書購買,iTunes購買介紹:這是一本由雪城大學新編的第二版《數據科學入門》教材:偏實用型,淺顯易懂,適合想學習R語言的同學選讀。介紹:這並不是一篇文檔或書籍。
  • 《中國科學》出版引力波天文學英文學術專題
    2016年2月11日,美國國家科學基金和歐洲引力天文臺召開對外新聞發布會,正式宣布有史以來,科學家第一次直接觀測到了來自遙遠宇宙的劇變事件所產生的時空漣漪
  • 獨家 | 如何為計算機視覺和深度學習安置英偉達?
    標籤:計算機視覺,深度學習之前我們討論了如何使用我的 pre-configured Nano .img file,那今天,你將學習從頭開始想學習如何安置你自己的Nano。本教程需要你有至少48小時的空餘時間完成你英偉達 Jetson Nano 的自主安置(是的,這就是這麼有挑戰)。
  • SSPMA速遞|《中國科學:物理學 力學 天文學》中文版2021年第10期
    北京航天長徵飛行器研究所五十周年所慶航天力學專題·編者按沈波 中國科學: 物理學 力學 天文學 51 (10) , 104701 (2021)https://doi.org/10.1360/SSPMA-2021-0256中國科學: 物理學 力學 天文學 51
  • 深度學習在計算機視覺領域應用一覽(附連結)
    這是一份深度學習在計算機視覺領域的超全應用預覽~簡單回顧的話,2006年Geoffrey Hinton的論文點燃了「這把火」,現在已經有不少人開始潑「冷水」了,主要是AI泡沫太大,而且深度學習不是包治百病的藥方。
  • 計算機視覺方向簡介 | 深度學習視覺三維重建
    現在每個人都在研究識別,但識別只是計算機視覺的一部分。真正意義上的計算機視覺要超越識別,感知三維環境。我們活在三維空間裡,要做到交互和感知,就必須將世界恢復到三維。所以,在識別的基礎上,計算機視覺下一步必須走向三維重建。本文筆者將帶大家初步了解三維重建的相關內容以及算法。在計算機視覺中, 三維重建是指根據單視圖或者多視圖的圖像重建三維信息的過程.
  • 一文全覽深度學習在計算機視覺領域的應用
    已經是很熱的深度學習,大家都看到不少精彩的故事,我就不一一重複。簡單的回顧的話,2006年Geoffrey Hinton的論文點燃了「這把火」,現在已經有不少人開始潑「冷水」了,主要是AI泡沫太大,而且深度學習不是包治百病的藥方。計算機視覺不是深度學習最早看到突破的領域,真正讓大家大吃一驚的顛覆傳統方法的應用領域是語音識別,做出來的公司是微軟,而不是當時如日中天的谷歌。
  • 淺談深度學習的技術原理及其在計算機視覺的應用
    目前,深度學習幾乎成了計算機視覺領域的標配,也是當下人工智慧領域最熱門的研究方向。計算機視覺的應用場景和深度學習背後的技術原理是什麼呢?下面讓我們來一探究竟。計算機視覺的應用什麼是計算機視覺呢?形象地說,計算機視覺就是給計算機裝上眼睛(照相機)和大腦(算法),讓計算機可以感知周圍的環境。
  • Python深度學習(Deep Learning with Python) 中文版+英文版+原始碼免費分享
    ,涉及計算機視覺、自然語言處理、生成式模型等應用。在學習完本書後,讀者將了解深度學習、機器學習和神經網絡的關鍵概念,具備搭建自己的深度學習環境、建立圖像識別模型、生成圖像和文字等能力,學會解決現實世界中的深度學習問題。除此之外,本書還深刻剖析了當前的「人工智慧熱」,從理性的視角展望了深度學習在未來的可能性。
  • PNAS 「深度學習的科學」論文合集導讀
    最初的成功包括將貓和狗的圖片分離開來,但很快成功的就是全面的計算機視覺問題,比如人臉識別和運動圖像中的行人跟蹤。 在圖像處理取得初步成功的幾年後,深層網絡開始滲透到自然語言處理中,最終在最大的工業研究團隊手中產生了能夠將105種語言中的任何一種翻譯成任何其他語言的系統,甚至是之前幾乎沒有翻譯例子的語言對。
  • 真的,關於深度學習與計算機視覺,看這一篇就夠了 硬創公開課
    今天,我們邀請到慧眼科技研發總監李漢曦,為我們帶來深度學習與計算機視覺方面的內容分享。▌前深度學習時代的計算機視覺網際網路巨頭看重深度學習當然不是為了學術,主要是它能帶來巨大的市場。那為什麼在深度學習出來之前,傳統算法為什麼沒有達到深度學習的精度?在深度學習算法出來之前,對於視覺算法來說,大致可以分為以下5個步驟:特徵感知,圖像預處理,特徵提取,特徵篩選,推理預測與識別。
  • 國內外優秀的計算機視覺團隊匯總
    ,國內外優秀的計算機視覺團隊有很多,我這裡只是列舉了自己從知乎、CSDN等網站上收集到的,如有遺漏,還請諒解。北京大學:林宙辰,查紅彬,施柏鑫,曾剛 (zeng@pku.edu.cn),劉家瑛,穆亞東中科院:跨媒體計算研究組中科院計算所:高文(VIPL視覺信息處理與學習研究組),陳熙霖,山世光中科院自動化所:譚鐵牛(智能感知與計算研究中心),李子青(生物識別與安全技術研究中心),模式識別重點實驗室中科院信工所:王蕊中科院深圳先進院:喬宇