計算機視覺不是智能,只是記憶:CVPR 2019程序主席開炮

2020-12-17 機器之心Pro

選自Medium

作者:Derek Hoiem

機器之心編譯

參與:路、杜偉

計算機視覺頂會 CVPR 2019 剛剛落下帷幕,近日 CVPR 2019 程序主席 Derek Hoiem 發表了一篇文章,認為計算機視覺正處於黃金時代,但它依靠的只是記憶,並非真正的智能。

隨著人工智慧的火熱,近年來 AI 學術會議正受到人們越來越多的關注。CVPR 作為首屈一指的年度計算機視覺盛會,在機器學習領域享有盛名。該會議已於當地時間 6 月 16 日-20 日在美國加州長灘舉行。據統計,CVPR 2019 共收到來自全球 14,104 位作者提交的 5160 篇論文(比 CVPR 2018 增加 56%),最終接收了 1294 篇,接收率約為 25%。CVPR 2019 共有 9227 人註冊參會,突破歷屆記錄。

CVPR 2019 程序主席、伊利諾伊大學香檳分校(UIUC)計算機科學副教授教授 Derek Hoiem 認為計算機視覺正處於黃金時代,但他也認為計算機視覺目前仍依靠記憶,大量方法不具備泛化性。

讓我們看看他是怎麼說的:

對於計算機視覺研究者而言,這是令人振奮但也壓力倍增的時代。上周二,本人有幸在 CVPR 2019 大會上向 9,277 位參與者致開幕詞。作為 CVPR 2019 四位程序委員會主席之一,本人主要負責管理論文評審流程(涉及 132 位領域主席、2887 位審稿人,以及提交 5160 份論文的 14104 名作者),並組織 1296 場 poster 論文的展示和 288 場演講。這是歷史上規模最大的計算機視覺會議,但四個月後會召開另一場盛會。

研究成果日新月異——誰又能跟上研究步伐呢?

CVPR 各年度論文提交數量(藍色)和接收數量(綠色)。

計算機視覺不再只是一種學術追求。數十億美元正投入到智能攝像機、自動駕駛等應用中。大多數教授至少花費一半的時間投身於工業,甚至剛畢業的博士生都可以拿到六位數的薪水。但這是泡沫嗎?我們又如何區分適用於商業化的成熟突破和炒起來的概念驗證呢?

首先,讓我們簡單回顧一下計算機視覺的發展歷程:

1963 年:Robert 的經典「積木世界」(Blocks World)論文利用精心設計的特徵和規則,構建圖像的 3D 目標。1981 年:Lucas 和 Kanade 在僅僅 6 頁紙上,提出了用於運動跟蹤和立體視覺的有效算法,之後幾何視覺和圖像處理領域出現大量進展。1996 年:Rowley、Baluja 和 Kanade 介紹了首個現代目標檢測方法,這是一個訓練用於檢測人臉的神經網絡。數字圖像激增,數據取代了規則。2012 年:藉助於數以百萬計的標註圖像和 GPU 算力,Krizhevsky、Sutskever 和 Hinton 證明了深度學習的強大效能,將同類方法的誤差降低了一半。數據取代了手工製作的特徵。2019 年:人臉識別、人體跟蹤和常見物體檢測實現了魔法般的效果。基於單個圖像的深度預測看起來棒極了。但只有新手才會試圖用不到 100,000 張標註圖像來解決問題。數據標註行業誕生了。

那麼,這就該提到計算機視覺領域的公開秘密了:計算機視覺只是記憶,而不是智能。

我們來看一個單視角深度預測的例子。2005 年,我提出了首個基於戶外圖像自動創建 3D 模型的方法。該方法的關鍵是通過標註像素、利用透視幾何規則構建簡單的場景幾何模型,以學習「識別」圖像的幾何。該方法在 30% 的情況下是有效的。

單視角 3D 重建的一種早期方法:少量數據、手動製作的特徵,以及一些數學知識。

單視角 3D 重建現在已經成為熱門話題,僅 CVPR 2019 就收到了大約 35 篇相關論文。一些方法能夠基於全景圖像生成場景布局,基於圖像生成目標網格,基於單視角生成深度圖。

但是,就像我和 UCI 的研究者發表在 CVPR 2018 的論文《Pixels, voxels, and views: A study of shape representations for single view 3D object shape prediction》以及德國弗萊堡大學研究者發表在 CVPR 2019 的論文《What Do Single-view 3D Reconstruction Networks Learn?》所指出的那樣,很多看似能解釋圖像幾何的方法實際上只是在學習過程中記住了圖像的幾何信息,並通過檢索與輸入類似的樣本來執行預測。預測得到的 3D 模型看似很好,但這些方法無法泛化到新的形狀或場景。

那麼,我們來考慮 3D 重建的兩個重要問題:

圖像深度。拍一張照片然後發到辦公室,就可以做 3D 測量和 QA/QC,豈不妙哉?再也用不著昂貴的雷射掃描儀和複雜的攝影測量學了。夢境很美,但是現在請睜開你的眼睛。Matterport 公司最近發布了一款基於 360 度全景圖像進行深度預測的工具,這是一項卓越的數據收集和機器學習壯舉。相關的深度預測效果很好,邊也在正確的位置。但是它需要將一臺 Ricoh Theta 全景相機放置在高度已知的三腳架上,由於相機參數和姿勢都是未知的,因此這引入了一些變化因素。而且它在使用時仍然不夠準確,編碼器-解碼器策略是一種記憶形式,因此在未來相當長的時間內,基於高度可變的構建場景執行預測很可能出現錯誤。現在,3D 最好還是留給無人機、視頻捕捉和掃描儀吧。我對將單視角識別和分割的深度方法與可生成準確幾何的多視角方法結合起來的潛力很感興趣。自動進度監控。Reconstruct 公司將點雲和圖像與 BIM 對齊,以更便捷地進行自動對比、規劃和進度評估。這裡存在的巨大挑戰是構建元素和任務多種多樣,觀測結果不完整,需要同時評估幾何和材料屬性,以及如何獲取標註數據。一些人聲稱可以做到自動進度監控,但是缺乏數據和專業知識,我認為這些言論不適用於廣泛的應用。但是,語義分割領域的近期進展,以及如果有合適的數據,未來一兩年自動進度監控或許可以實現,至少可以用於粗略評估正在進行的工作。

總之,如果有人稱其最新解決了一個關於識別或預測的難題,請先問自己一個問題:他們有足夠的數據,支持其方法記住所有答案嗎?

要做到這一點,他們需要 1)具備海量數據;2)在數據標註上花費大量金錢(數百萬),或者擁有自動標註方法;3)預測問題足夠簡單,且你的領域足夠有限可以被他們的數據和標籤覆蓋。

幾十億美元的圖像標註行業的存在是有理由的,而且截至目前,數據沒有替代品。

原文連結:https://medium.com/reconstruct-inc/the-golden-age-of-computer-vision-338da3e471d1

相關焦點

  • 從CVPR2019看計算機視覺的最新趨勢
    2019年IEEE計算機視覺與模式識別大會(CVPR)於今年6月16日至20日舉行。CVPR是計算機視覺領域世界三大學術會議之一(與ICCV和ECCV並列)。今年共收到1300篇論文,錄取率達到創紀錄的5165篇(25.2%)。
  • 新智元專訪CVPR2019程序主席微軟華剛 :arXiv讓雙盲評審形同虛設...
    作為CVPR 2019的程序主席,CVPR 2017和ICCV 2017的領域主席,華剛表示他很高興看到在本屆CVPR上出現了不少嘗試進一步理解深度學習在解決計算機視覺問題中的工作機制,和將計算機視覺領域知識用於指導深度學習的論文。
  • 【收藏】2019年不容錯過的20大人工智慧/機器學習/計算機視覺等頂會時間表
    本文介紹了2019年值得關注的20個頂會,包括人工智慧、機器學習、計算機視覺、自然語言處理、體系結構等領域。目錄人工智慧/機器學習計算機視覺/模式識別自然語言處理/計算語言學體系結構數據挖掘/信息檢索計算機圖形學1.
  • 【快訊】CVPR2021結果出爐,1663篇上榜, 你的paper中了嗎?
    【導讀】計算機視覺頂會CVPR2021接收論文列表已公布,你的文章中了嗎?
  • CVPR2019| 05-17更新11篇論文及代碼合集(含一篇oral,視覺跟蹤/實例分割/行人重識別等)
    加入極市專業CV交流群,與6000+來自騰訊,華為,百度,北大,清華,中科院等名企名校視覺開發者互動交流!
  • 投稿量激增56%,CVPR 2019接收論文的關鍵詞是什麼?
    CVPR 是計算機視覺領域的頂級學術會議,在機器學習領域享有盛名。今年的 CVPR 將於 6 月 16 日-20 日於美國加州的長灘市舉行。本屆 CVPR 大會共收到 5165 篇有效提交論文,比去年增加了 56%。大會接收了其中的 1300 篇,接收率約為 25.1%。
  • 【收藏】2018年不容錯過的20大人工智慧/機器學習/計算機視覺等頂會時間表
    本文介紹了2018年值得關注的20個頂會,包括人工智慧、機器學習、計算機視覺、自然語言處理、體系結構等領域。目錄人工智慧/機器學習計算機視覺/模式識別自然語言處理/計算語言學體系結構數據挖掘/信息檢索計算機圖形學1.
  • 科大訊飛奪冠2019年度計算機視覺頂級會議CVPR和ICDAR多項評測
    科大訊飛A.I.研究院聯合中科大語音及語言信息處理國家工程實驗室(NELSLIP)(以下統稱為訊飛-中科大聯合團隊)在近期舉辦的計算機視覺頂級會議 在計算機視覺與模式識別國際會議(CVPR 2019)舉辦的物體檢測挑戰賽DIW 2019(Detection in the Wild challenge Workshop 2019)上取得Objects365 Tiny Track第一,Objects365 Full Track第三的佳績
  • OPPO斬獲全球計算機視覺頂級會議CVPR 2020兩項第一
    在今年的全球計算機視覺頂級會議CVPR(Conference on Computer Vision and Pattern Recognition國際計算機視覺與模式識別會議)上,OPPO獲得兩項第一名、兩項第三名。
  • 五年後的計算機視覺會是什麼樣?和CV先驅們一同暢想(上)|CVPR 2019
    雷鋒網 AI 科技評論按:對於計算機視覺研究者們來說,以當前的技術水平為基礎,尋找突破點做提升改進是科研的主旋律。這幾年來,計算機視覺領域的已有問題在研究者們的努力下普遍得到了越來越好的解決,映入大家視野的新問題也越來越多。
  • 五年後的計算機視覺會是什麼樣?和CV先驅們一同暢想(上) | CVPR 2019
    這幾年來,計算機視覺領域的已有問題在研究者們的努力下普遍得到了越來越好的解決,映入大家視野的新問題也越來越多。不過到了 CVPR 這個供全球計算機視覺研究者齊聚討論的盛會上,一個可能不那麼直接指導短期研究、不那麼容易形成共識問題也就自然地湧上了大家的心頭:在五到十年後的未來,計算機視覺的研究會是什麼樣子,是深度學習幾乎完全替代了目前還在使用的其他一些方法,還是我們應該期待新的革命?
  • 計算機視覺領域的王者與榮耀丨CCF-GAIR 2018
    當計算機視覺研究與落地大潮湧動之際,第三屆CCF-GAIR全球人工智慧與機器人峰會「計算機視覺專場」,眾多科技巨頭首席技術官、獨角獸首席科學家、國際學術頂會主席、世界名校AI實驗室主任將會公開分享最前沿的計算機視覺技術研究與商用成果。
  • 7位內地學者將擔任IJCAI2021程序委員會成員,周志華任主席!
    此前IJCAI大會官方正式宣布歐洲科學院外籍院士、南京大學計算機科學與技術系系主任、人工智慧學院院長周志華教授擔任「 IJCAI 2021 」程序主席,這也是 IJCAI 歷史上首次由華人擔任程序主席一職。
  • 計算機視覺、機器視覺、圖像處理以及人工智慧技術
    近幾年,人工智慧技術異常的火爆。在這個火爆的過程中,有的人看好,有的人看衰人工智慧。不管人工智慧技術未來再經歷幾次大起大落,目前人工智慧技術給我們帶來的落地的應用還是非常讓人滿意的。人工智慧技術目前已經落地的應用,主要集中在人臉識別、城市安防、自然語言翻譯與處理、智能推薦、自動駕駛等。
  • HCP Lab 12篇論文入選世界頂級計算機視覺會議 CVPR 2019
    雷鋒網 AI 科技評論按:本文由中山大學人機物智能融合實驗室(HCP Lab)特約供稿。全球計算機視覺三大頂會之一 CVPR 2019 (IEEE Conference on Computer Visionand Pattern Recognition) 於 6月 16~20日 在美國洛杉磯如期舉辦。
  • 小記CVPR2019 Area Chair會議 | 聯誼交流
    3)計算機視覺應該以什麼樣的角色融入人工智慧的發展呢?我以前寫過文章,講到人工智慧的發展,現在進入一個「戰國時期」,幾大學科在快速融合之中。計算機視覺這隻隊伍有先天優勢:視覺是智能的信息大門,計算機視覺研究人員習慣於複雜模型、大數據。最近,我看到計算機視覺不少人出任大公司的AI 實驗室主任、大學AI學院的院長,這是一個可喜的跡象。我希望看到更多的人朝這個方向走。
  • 計算機視覺頂會 ICCV 2019 投稿數量翻倍!
    雷鋒網 AI 科技評論:根據 ICCV 官方 Twitter 消息,ICCV 2019 一共收穫 4328 篇論文,與上一屆 2143 篇相比,數量多出了將近一倍。ICCV 由 IEEE 主辦,與計算機視覺模式識別會議(CVPR)和歐洲計算機視覺會議(ECCV)並稱計算機視覺方向的三大頂級會議。CVPR 每年召開一次,而 ECCV 和 ICCV 在世界範圍內每年間隔召開。
  • 五年後的計算機視覺會是什麼樣?和CV先驅們一同暢想(下)|CVPR 2019
    雷鋒網 AI 科技評論按:計算機視覺頂會 CVPR 2019 上舉辦了首屆「Computer Vision After 5 Years - CVPR Workshop」,領域內的多位知名學者受邀演講,和大家分享他們對於 5 年後的計算機視覺領域發展的看法。
  • 僅用40張圖片就能訓練視覺模型:CVPR 2019伯克利新論文說了什麼
    不過,依然很少有哪個能比得上CVPR在計算機視覺領域的影響力。其中, 又以oral口頭報導的文章最具重量級。那麼在CVPR 2019中,又有哪些成果獲此殊榮呢?如果只是簡單地將現有的計算機視覺分類放在現實中的識別問題上,結果會怎樣呢?伯克利的研究人員告訴你,就是被打臉。
  • 騰訊優圖25篇論文入選全球頂級計算機視覺會議CVPR 2019
    全球計算機視覺頂級會議 IEEE CVPR 2019(Computer Vision and Pattern Recognition,即IEEE國際計算機視覺與模式識別會議)即將於6月在美國長灘召開。本屆大會總共錄取來自全球論文1299篇。