計算機視覺與模式識別論文摘要:神經常規微分方程、推理視覺問答

2021-01-10 親愛的數據
神經常規微分方程

論文一:

標題:Neural Ordinary Differential Equations,神經常規微分方程

神經常規微分方程

論文摘要:介紹了一種新的深度神經網絡模型。我們使用神經網絡參數化隱藏狀態的導數,而不是一個具體指定的離散隱藏層的序列。運用黑盒微分方程求解器(blackbox differential equation solver)來計算網絡的輸出。這些連續深度模型具有恆定不變的儲存成本,可以根據輸入調整其評估策略,並且可以明顯地以精度換取速度(這裡只指數值的精度)。我們證明了非連續深度(continuous-depth)殘差網絡和連續時間潛在變量模型的性質。我們還構建了連續正則化流,這是一個可以通過最大似然進行訓練的生成模型,而無需對數據維度進行分區或排序的生成模型。

神經常規微分方程

對於訓練來說,我們將回答這樣一個問題:如何在不訪問任何常規微分方程(ODE)求解器內部操作的情況下,可伸縮地反向傳播(允許在更大的模型中對常規微分方程進行端到端訓練)?

論文二:

用圖卷積網絡進行推理,用於實際的可視

論文標題:Out of the Box: Reasoning with Graph Convolution Nets for Factual Visual Question Answering,開箱即用:用圖卷積網絡進行推理,用於實際的視覺問答

論文摘要:

準確地回答關於給定圖像的問題,需要結合一些觀察和一些常識。雖然這對人類來說易如反掌,但是用常識進行推理仍然是機器在算法上需要應對的挑戰。最近為了在這個方向上推進研究發展,提出了一項新的「基於事實」的視覺問題回答(FVQA)任務,大量的人工精心收集驗證的事實(facts),用來連接一組事物,例如這一組事物可能是兩個關係,或者是兩個可能的答案。

對於給定的一套問答圖片,採用深度網絡技術對大量的事實進行連續的簡化,直到最後剩下的一組(含兩個事物)中的一個被預測為答案。我們注意到,一個連續的過程,如果一次考慮一個事實,這會形成一個局部決策,這個決策是次優的。

與此相反,我們開發了一個對象圖(entity graph),並使用一個圖卷積網絡,通過共同考慮所有對象來「推理」出正確的答案。在具有挑戰性的視覺問題回答(FVQA)數據集,我們的方法顯示,可以提高約7%的準確性(與前沿技術水平比較) 。

該論文作者均來自於伊利諾伊大學香檳分校。(完)

親愛的數據

出品:譚婧

美編:陳泓宇

相關焦點

  • Facebook這個神經網絡用自然語言表示數學式,秒解微分方程!
    他們訓練了一個神經網絡來執行必要的符號推理,首次實現了對數學表達式的微分和積分。這項成果是邁向更強大的數學推理的重要一步,也是利用神經網絡超越傳統模式識別任務的新方法。在模式識別任務(如面部和物體識別,某些自然語言處理,甚至是玩象棋、圍棋和太空侵略者這樣的遊戲)上,神經網絡已經取得了巨大的成就。
  • 人工智慧與計算機視覺
    ,一個大量人員研究了多年的學科,卻很難給出一個嚴格的定義,模式識別如此,目前火熱的人工智慧如此,計算機視覺亦如此。計算機視覺是一門綜合性的學科,其中包括計算機科學和工程、信號處理、物理學、應用數學和統計學,神經生理學和認知科學等,同時與圖像處理,模式識別,投影幾何,統計推斷,統計學習等學科密切相關,近年來,與計算機圖形學,三維表現等學科也發生了很強的聯繫。  人工智慧與計算機視覺  計算機視覺與人工智慧有密切聯繫,但也有本質的不同。
  • 英偉達的STEAL AI讓神經網絡擁有更好的計算機視覺
    這些知識可以改進現有計算機視覺模型的推理,並為未來的模型標記訓練數據。在研究人員的實驗中,語義細化的邊緣對齊學習(steal)能夠將最先進的casenet語義邊界預測模型的精度提高4%。更精確地識別物體的邊界可以應用於計算機視覺任務,從圖像生成到三維重建到物體檢測。
  • 光學預處理與計算機視覺結合,UCR學者用漩渦實現混合計算機視覺系統
    在本文中,來自加州大學河濱分校機械工程系的研究者通過應用光學漩渦證明了混合計算機視覺系統的可行性。該研究為光子學在構建通用的小腦混合神經網絡和開發用於大數據分析的實時硬體方面的作用提供了新見解。從醫學診斷到自動駕駛再到人臉識別,圖像分析在現代技術中無處不在。使用深度學習卷積神經網絡的計算機徹底改變了計算機視覺。
  • 視覺感知-從人類視覺到計算機視覺
    1959年,哈佛醫學院的兩名神經生物學家David Hubel和Torsten Wiesel進行了一項驚人的實驗,揭示了人類視覺系統的幾個秘密,並獲得了2項諾貝爾獎。人們開始思考人類視覺已經解決的問題,例如人臉識別,物體識別和分割。 1966年,麻省理工學院夏季視覺項目(MIT Summer Vision Project)在麻省理工學院開始了首次正式的計算機視覺工作,旨在在1966年夏季解決計算機視覺問題。
  • 全球計算機視覺頂會CVPR 2019論文出爐:騰訊優圖25篇論文入選
    全球計算機視覺頂級會議 IEEE CVPR 2019(Computer Vision and Pattern Recognition,即IEEE國際計算機視覺與模式識別會議) 即將於6月在美國長灘召開。本屆大會總共錄取來自全球論文1299篇。
  • 西工大王鵬教授課題組論文被計算機視覺頂級會議CVPR2020錄用
    西工大新聞網2月26日電(王寧 高揚)2月24日,我校計算機學院王鵬教授課題組論文被2020年IEEE國際計算機視覺與模式識別會議(IEEE Conference on ComputerCVPR會議始於1983年,由IEEE舉辦,是計算機視覺和模式識別領域的頂級會議。今年CVPR共收到的投稿超過7000篇,有效論文投稿為6656篇,最終收錄數量為1470篇,收錄率為22.0%。
  • 果蠅的視覺模式識別具有視網膜位置不變性
    首次發現果蠅具有視覺不變性,該項研究發表在Science上,使昆蟲視覺與脊椎動物在認知層面上統一起來,對於視覺神經機制研究有著重要啟示。目前研究將高密度電極陣列發展成為與FMRI、光學成像同等重要的腦功能成像方法,用於解決時間編碼、功能柱內編碼、不變性神經機制等認知神經科學中懸而未決的科學難題。
  • 「神經常微分方程」提出者之一:如何利用深度微分方程模型處理連續...
    多倫多大學助理教授、向量學院聯合創始人、NeruIPS 2018 最佳論文獎得主,將帶著對微分方程和連續時間的最新思考出現在 WAIC 開發者日。提到 David Duvenaud 你或許有些陌生,但最近大熱的「神經常微分方程」想必你一定聽說過。
  • 包括的領域有計算機視覺,語音識別,自然語言處理,圖像識別等
    現在人工智慧已經包括的領域有計算機視覺,語音識別,自然語言處理,圖像識別等。人工智慧的步驟人工智慧基本步驟包括,信息提取->信息分析->假設建模->學習->泛化,具體步驟。如果說計算機視覺是讓計算機看到一張黑白的二維圖像,那麼它可以識別字符串,可以通過圖像獲取某個標註的信息,它具有特定的識別圖像,可以從圖像分析出某個基本的結構。
  • 2018最具突破性計算機視覺論文Top 10
    examples)的影響:圖像中的微小變化會導致計算機視覺模型出錯,比如把一輛校車誤識別成鴕鳥。在這篇論文中,我們通過利用最近的技術來解決這個問題,這些技術可以將具有已知參數和架構的計算機視覺模型轉換為具有未知參數和架構的其他模型,並匹配人類視覺系統的初始處理。我們發現,在計算機視覺模型之間強烈轉移的對抗性樣本會影響有時間限制的人類觀察者做出的分類。
  • 全球計算機視覺頂會CVPR 2020論文出爐:騰訊優圖17篇論文入選
    全球計算機視覺頂級會議CVPR2020 (IEEE Conference on Computer Vision and Pattern Recognition,即IEEE國際計算機視覺與模式識別會議) 即將於2020年6月14日-19日在美國西雅圖召開。本屆大會總共錄取來自全球論文1470篇,騰訊優圖實驗室入選17篇。
  • 騰訊優圖25篇論文入選全球頂級計算機視覺會議CVPR 2019
    全球計算機視覺頂級會議 IEEE CVPR 2019(Computer Vision and Pattern Recognition,即IEEE國際計算機視覺與模式識別會議) 即將於6月在美國長灘召開。本屆大會總共錄取來自全球論文1299篇。
  • 計算機視覺和圖像處理之間有什麼區別?
    現代機器視覺系統背後的的核心動機在於模擬人類視覺,用於識別圖案,面部以及將將2D圖像轉化為3D模型等。在概念層面,圖像處理和計算機視覺之間存在很多重疊,並且經常被誤解的術語可以互換使用。在這裡,我們簡要概述了這些技術,並解釋了它們在基礎層面上的不同之處。
  • HCP Lab 12篇論文入選世界頂級計算機視覺會議 CVPR 2019
    全球計算機視覺三大頂會之一 CVPR 2019 (IEEE Conference on Computer Visionand Pattern Recognition) 於 6月 16~20日 在美國洛杉磯如期舉辦。CVPR 作為計算機視覺三大頂級會議之一,一直以來都備受關注。被 CVPR 收錄的論文更是代表了計算機視覺領域的最新發展方向和水平。
  • ...計算機視覺的廣泛應用:網絡壓縮、視覺問答、可視化、風格遷移等
    本系列文章旨在直觀系統地梳理深度學習各領域常見概念與基本思想,使讀者對深度學習的重要概念與思想有一直觀理解,做到「知其然,又知其所以然」,從而降低後續理解論文及實際應用的難度。本系列文章力圖用簡練的語言加以描述,避免數學公式和繁雜細節。本文是該系列文章中的第三篇,旨在介紹深度學習在計算機視覺的其他任務的應用。
  • 一文帶你讀懂計算機視覺
    >自動標記應用程式的圖片從視頻(電視節目,電影)中提取信息視覺問答藝術關注的人使用許多卷積層的神經網絡就是其中之一。一個卷積層利用圖像的2D結構在神經網絡的下一層中生成有用信息。基於卷積的深度神經網絡在目標識別任務上取得了很好的效果。ILSVR會議一直在ImageNet(http://www.image-net.org/ 一個有許多圖片的數據集,包括貓,狗等物品標籤)上舉辦競賽。越成功的神經網絡使用的層數會越來越多。
  • 可微分的「OpenCV」:這是基於PyTorch的可微計算機視覺庫
    機器之心整理參與:思如何打造一個可微分的 OpenCV?如何將圖像處理嵌入到訓練流程中?你需要 Kornia 這個開源可微的計算機視覺庫。在這個項目中,開發者提出了一種新型開源可微分計算機視覺庫 Kornia,並且它建立在 PyTorch 之上。Kornia 包含了一組例程和可微分模塊,並致力於解決通用計算機視覺問題。在 Kornia 的核心代碼中,它使用 PyTorch 作為主要後端,並高效地利用反向模式自動微分機制來定義並計算複雜函數的梯度。
  • 一文詳解計算機視覺的廣泛應用:網絡壓縮、視覺問答、可視化、風格...
    原標題:一文詳解計算機視覺的廣泛應用:網絡壓縮、視覺問答、可視化、風格遷移等 本系列文章旨在直觀系統地梳理深度學習各領域常見概念與基本思想,使讀者對深度學習的重要概念與思想有一直觀理解,做到「知其然,又知其所以然」,從而降低後續理解論文及實際應用的難度。本系列文章力圖用簡練的語言加以描述,避免數學公式和繁雜細節。本文是該系列文章中的第三篇,旨在介紹深度學習在計算機視覺的其他任務的應用。
  • 李飛飛:在物體識別之後,計算機視覺還要多久才能理解這個世界
    上午,著名華人計算機視覺專家、斯坦福副教授李飛飛,在溫哥華會議中心面向全體與會專家學者作了長達一小時的專題報告。在昨天發布的雷鋒網文章 上篇:「李飛飛:為什麼計算機視覺對機器人如此重要? | IROS 2017」中,李飛飛介紹了視覺對生物的重要性,以及計算機視覺在物體識別任務中的飛速發展。