光學預處理與計算機視覺結合,UCR學者用漩渦實現混合計算機視覺系統

2020-12-27 澎湃新聞

機器之心報導

作者:杜偉、小舟

在本文中,來自加州大學河濱分校機械工程系的研究者通過應用光學漩渦證明了混合計算機視覺系統的可行性。該研究為光子學在構建通用的小腦混合神經網絡和開發用於大數據分析的實時硬體方面的作用提供了新見解。

從醫學診斷到自動駕駛再到人臉識別,圖像分析在現代技術中無處不在。使用深度學習卷積神經網絡的計算機徹底改變了計算機視覺。但卷積神經網絡(convolutional neural network,CNN)通過從預訓練數據中學習來對圖像進行分類,然而這些數據通常會記住或發展某些偏見。此外,數據還易於受到對抗性攻擊(以極細微且幾乎察覺不到的圖像扭曲出現)的幹擾,從而導致做出錯誤的決策。這些缺點限制了卷積神經網絡的用途。

提升圖像處理算法能效和可靠性的一種方法是將常規計算機視覺與光學預處理器結合起來。這種混合系統可以用最少的電子硬體工作。由於光在預處理階段即可完成數學函數而不會耗散能量,因此使用混合計算機視覺系統可以節省大量時間和能源。這種新方法能夠克服深度學習的缺點,並充分利用光學和電子學的優勢。

今年 8 月份,在一篇發表於 Optica 的論文中,加州大學河濱分校機械工程系助理教授 Luat Vuong 和博士生 Baurzhan Muminov 通過應用光學漩渦(具有深色中心點的旋繞光波),證明了混合計算機視覺系統的可行性。光學漩渦可以比喻為光繞著邊緣和角落傳播時產生的流體動力漩渦。

論文連結:https://www.osapublishing.org/optica/fulltext.cfm?uri=optica-7-9-1079&id=437484

研究表明,光學預處理可以降低圖像計算的功耗,而電子設備中的數位訊號識別相關性,提供優化並快速計算可靠的決策閾值。藉助混合計算機視覺,光學器件具有速度和低功耗計算的優勢,並且比 CNN 的時間成本降低了 2 個數量級。通過圖像壓縮,則有可能從存儲和計算複雜性兩方面大幅減少電子後端硬體。

Luat Vuong 表示:「本研究中的漩渦編碼器表明,光學預處理可以消除對 CNN 的需求,比 CNN 更具魯棒性,並且能夠泛化逆問題的解決方法。例如當混合神經網絡學習手寫數字的形狀時,它可以重建以前從未見過的阿拉伯或日語字符。」

該論文還表明,將圖像縮小為更少的高強度像素能夠實現極弱光線條件下的圖像處理。該研究為光子學在構建通用的小腦混合神經網絡和開發用於大數據分析的實時硬體方面的作用提供了新見解。

論文內容簡述

深度學習卷積神經網絡通常涉及具有較高計算成本的多層、前向 - 後向傳播機器學習算法。所以,在本文中,研究者展示了卷積神經網絡的替代方案,該方案從其光學預處理、傅立葉編碼模式中重建原始圖像。該方案對計算的需求少得多,並且具有更高的噪聲魯棒性,因此適用於高速和弱光照條件下的成像。

具體而言,該研究引入帶有微透鏡陣列的漩渦相位變換,以及淺層密集的「小腦」神經網絡結合。單次編碼孔徑方法利用了傅立葉變換螺旋相位梯度的相干衍射、緊湊表徵和邊緣增強。使用漩渦編碼可以訓練小腦對圖像進行去卷積操作,其速度比使用隨機編碼方案快 5 至 20 倍,且在存在噪聲的情況下獲得了更大的優勢。

一旦訓練完成,小腦就可以從 intensity-only 的數據中重建對象,從而解決了逆映射問題,而無需在每個圖像上執行迭代,也無需深度學習方案。通過漩渦傅立葉編碼,研究者在 15W CPU 上以每秒幾千幀的速度重建以低光通量(5nJ / cm^2)照明的 MNIST Fashion 對象。最終,研究者證明了使用漩渦編碼器進行傅立葉光學預處理在達到相似準確率的情況下,速度比卷積神經網絡快 2 個數量級。

漩渦的知識可以擴展為理解任意波型。當帶有漩渦時,光學圖像數據會以突出顯示並混合光學圖像不同部分的方式實現傳播。研究者指出,使用淺層「小腦」神經網絡進行的漩渦圖像預處理(僅需運行幾層算法)就可以代替 CNN 發揮作用。

Vuong 還表示:「光學漩渦的獨特優勢在於其數學和邊緣增強功能。在本文中,我們證明了,光學漩渦編碼器能夠以類似於一種小腦神經網絡從其光學預處理模式快速重建原始圖像的方式生成目標強度數據。」

方法

圖 1 描述了該研究的成像方案,其中對象 F(r,Φ) 的多個圖像被收集到傅立葉域中:透過每個微透鏡的光由不同的漩渦和透鏡 mask 模式 M_m(r,Φ) 調製;攝像機檢測到菲涅耳(Fresnel)傳播、漩渦傅立葉變換(vortex-Fourier-transformed)強度模式的縮放模平方圖像

其中,m 是漩渦拓撲電荷,r 和Φ是實域柱面坐標,而 u 和 v 是傅立葉平面笛卡爾坐標。漩渦傅立葉強度模式 F^~ 集中在相對較小的區域中,但隨著 m 的增加,通常會呈越來越寬的甜甜圈形(圖 1(b))。對象「實域」中的漩渦相位在空間上編碼並破壞了傅立葉變換強度模式的平移不變性,如圖 1(c) 所示。

此外,該研究將一些小圖像數據集視為對象輸入,並比較 F(r,Φ) 中的不同表徵。對於每個正實值數據集圖像 X,相位變化的映射如下公式所示:

其中,α_0 是對象相位移動的動態範圍。這種映射很方便,因為信號功率不隨選擇的 X 改變。研究者還考慮了 X 閉塞或吸收信號時不透明對象,即

,這會產生相似的趨勢。

歸根結底,該研究有三項主要創新:(1)用漩渦透鏡進行光譜特徵的邊緣增強;(2)在沒有相似學得數據集的情況下對圖像進行快速逆重建;(3)取決於層激活的抗噪聲能力。

感興趣的讀者可以閱讀論文原文,了解更多研究內容。

參考連結:https://news.ucr.edu/articles/2020/12/11/optical-pre-processing-makes-computer-vision-more-robust-and-energy-efficient

本周六,WAIC開發者·2020上海臨港人工智慧開發者大會將震撼來襲。

全球頂尖AI專家齊聚主論壇,解讀智能化轉型的技術之道。4場技術工作坊分享智慧城市、智能出行、華為開源生態與邊緣智能引擎等話題,2場黑客松等你來戰。

原標題:《光學預處理與計算機視覺結合,UCR學者用漩渦實現混合計算機視覺系統》

閱讀原文

相關焦點

  • 計算機視覺的真實應用範例
    計算機視覺,無論是基於硬體還是軟體算法,大多還停留在「cool」的階段,計算機視覺的真實應用範例,它有什麼用,似乎離我們普通人還比較遠。看完這篇文章,也許你就不會這麼認為。發現雪白桌面上一張同樣雪白的 A4 紙?提前一秒預知你的動作是否存在威脅?出現危險情況時,對著鏡頭做「SOS」的手勢警察就會來幫助你? 這些太像科幻片?
  • 計算機視覺方向簡介 | 多視角立體視覺MVS
    相鄰像素通常通過4鄰域或8鄰域系統來定義。前者像素連接水平和垂直相鄰像素。後者另外相鄰的對角線像素也相互連接。4鄰域系統具有較少的交互條件且更便宜,但可能受到離散化畸變的影響更大。單元能量(Unary Potentials)單元標籤成本Φ(·)反映了圖像一致性信息,其中成本應與圖像一致性得分成反比,單元成本的確定義各不相同。
  • 淺談計算機視覺中的圖像標註_易車網
    什麼是計算機視覺?計算機視覺被認為是機器學習和人工智慧發展的重要領域之一。簡而言之,計算機視覺是人工智慧研究領域,致力於賦予計算機看世界和視覺解釋世界的能力。更進一步的說,計算機視覺是一門研究如何使機器「看」的科學,就是是指用攝影機和電腦代替人眼對目標進行識別、跟蹤和測量等機器視覺,並進一步做圖形處理,使電腦處理成為更適合人眼觀察或傳送給儀器檢測的圖像。計算機視覺的應用非常廣泛,從自動駕駛汽車和無人機到醫療診斷技術和面部識別軟體,計算機視覺的應用是巨大的和革命性的。
  • AlphaGo 早已擊敗圍棋冠軍,計算機視覺還是 3 歲的 「智力」
    20 世紀 50 年代和 60 年代,計算機視覺並沒有被看成重頭戲,人們認為視覺系統很容易複製,而教計算機下棋更加困難。但是現在,AlphaGo 已經擊敗圍棋冠軍,IBM Watson 也在 Jeopardy 中擊敗人類競賽者,而大多數計算機視覺軟體最多只能完成 3 歲兒童的任務……理論與實踐不斷證明,人類視覺神經非常複雜,計算機視覺實現並非易事。計算機視覺研究從上世紀 50 年代興起之後,也歷經了狂歡、冷靜,又重新燃起希望的階段。
  • 計算機視覺華人鼻祖黃煦濤過世
    美國工程院院士、中國科學院外籍院士、計算機視覺華人鼻祖黃煦濤(Thomas S. Huang)於2020年4月25日夜間在美國印第安納小女兒家過世。3個月前,其夫人Margaret也在家人陪伴下過世。
  • 計算機視覺進展二十年 (1995~2015)
    計算機視覺的兩大主要板塊是:幾何和識別,這裡我們主要來講述計算機視覺在1995—2015年間的進展。
  • 南京大學繆峰團隊在「垂直結構」新型類腦視覺系統方面取得重要進展
    海歸學者發起的公益學術平臺 分享信息,整合資源 交流學術,偶爾風月 視覺系統是人類用來觀察並認知外部世界的最重要的感覺系統
  • 成人網站Pornhub上線了AI系統,用計算機視覺識別藝人和姿勢
    維金 編譯整理量子位 出品 | 公眾號 QbitAI熱門「成人娛樂」網站Pornhub將開始使用一種新的人工智慧系統,基於面部識別技術來自動識別成人明星
  • 基於英特爾AI計算機視覺的新創中天智能交通路側視頻邊緣計算設備
    通過對於人工智慧、計算機視覺、雲計算和大數據等技術的融合應用,智能交通管理系統將使得道路使用者(人與各種車輛)與道路交通設施和諧互動,有助於提升交通安全與效率(包括緩解交通擁堵),從而改善人民的出行體驗。
  • 斯坦福AI實驗室:如何打造基於計算機視覺的智能醫院
    實際上,很多技術都可以解決這個問題,最簡單也最常用的就是用計算機視覺技術來檢測人們有沒有洗手。為什麼選擇計算機視覺技術?醫院們會通過醫學院課程、布告欄海報和員工周會等方式來加強手部衛生教育。世界衛生組織甚至提出「手部衛生五大時刻」,明確規定了醫療衛生工作者的洗手時間。為了核查手部衛生落實情況,醫院使用RFID卡或員工徽章來跟蹤手部衛生工作。在某種程度上,這些工具真的有用,但是也會碰到工作流程中斷的情況,比如當員工進入新房間時,肥皂盒會刷到RFID卡。
  • 為何計算機視覺落地難?別說我沒告訴你AI數據的重要性
    計算機視覺作為人工智慧關鍵技術之一,可廣泛應用於交通、零售、醫療、安防、金融、農業、製造業等領域,具有巨大的應用價值。根據前瞻產業研究院的統計,國內人工智慧企業中,有高達42%的企業應用計算機視覺相關技術,其次是語音和自然語言處理,分別佔比24%、19%,兩者之和才與計算機視覺佔比相當。
  • AWS Panorama是否會為計算機視覺遊戲帶來新的面貌?
    這些服務建立在Avant級機器學習,傳感器分析和計算機視覺功能上。這些服務的主要目標是解決工業客戶遇到的通用技術挑戰,並代表現有的最全面的雲到邊緣工業機器學習服務套件。在這些機器學習AWS服務中,AWS Panorama Appliance和AWS Panorama SDK受到了廣泛關注。
  • 知乎高贊:985計算機視覺畢業後找不到工作怎麼辦?
    知友@mileistone說: 現在市場出現了一個看起來很矛盾的現象,招聘公司覺得計算機視覺算法工程師難招;計算機視覺算法工程師應聘者覺得工作難找。 前幾年因為人工智慧大火,非常多人轉行進入計算機視覺領域,供給遠遠大於需求,給應聘者以工作難找的感覺。
  • 麥克阿瑟天才獎得主解碼計算機視覺「原罪」:AI 如何認識人類世界
    計算機視覺中使用最廣泛的一張女性圖像,是《花花公子》的「11月小姐」現年43歲Paglen認為,他的使命是聚焦我們周圍的數據交換、監控和自動化數據結構。他最近嘗試將相機對準世界的觀察者——各種監控攝像頭,Paglen深入了自動化系統的大腦,揭示了AI系統「眼中所見的事物」。
  • 國內計算機視覺行業盈利空間巨大,CV四小龍企業競爭激烈
    國內計算機視覺行業盈利空間巨大,CV四小龍企業競爭激烈 朱茜 發表於 2020-12-22 15:59:26 全球人臉識別系統行業處於蓬勃發展的態勢。
  • 用計算機「再造」新世界
    素有「計算機界諾貝爾獎」之稱的圖靈獎規格極高,通常一年只授予一名計算機科學家,只有少數情況下才會有兩名合作者或在同一方向獲得巨大突破的科學家獲此殊榮。這次頒獎,也是繼1988年之後,計算機圖形學再次加冕這項桂冠。 實現物體全方位形狀的數位化 究竟什麼是計算機圖形學?
  • 量子物理有什麼用?或許是下一代計算機
    與想像中不同的是,大概兩平米的費米混合實驗臺上安裝得最多的實驗用具是透鏡,將光通過雷射冷凍到接近絕對零度,科學家們就能研究和操縱粒子為己所用。最接近實現的目標之一,就是利用量子計算,製造比超級計算機還要快上幾萬倍的計算設備——「超級計算機時過去 30 年以來的技術,量子計算機是後 30 年的技術。」量子計算機是如何工作的?
  • 腦力影像視覺訓練系統簡介
    如同物理治療可以改善運動功能,腦力影像視覺訓練能顯著提高視力、增進視覺技巧、開發視覺潛能、改進視覺功能。是一種行之有效的恢復和重建視覺功能的方法,也是一門治療眼部疾病和提高視覺功能的科學。傳統的視覺訓練包括在醫院進行的治療和在家庭進行的各種訓練,包括:傳針、穿珠子、描圖、增視儀、光刷儀、同視機、離子導入儀、綜合弱視治療儀、直線機等。
  • 李飛飛ImageNet獲計算機視覺基礎貢獻獎
    作為計算機視覺和模式識別的頂級學術會議,每年的 CVPR 都匯聚了領域技術發展的前沿。而 CVPR 的最佳論文則更是備受關注,多有經典。本屆CVPR組織者中也不乏華人學者面孔,除UCLA朱松純教授擔任大會主席外,便利蜂 AI 研究院的華剛博士、加州大學聖地牙哥分校的屠卓文擔任程序主席。會議的132位領域主席中,也有多位華人面孔,比如白翔、程明明、孫劍、賈佳亞、林達華、呂樂、馬毅、蘇昊\顏水成、虞晶怡、張正友等等(不完全統計)。
  • 深度 歐洲計算機視覺會議(ECCV)開幕在即,搶先看Facebook將展示哪些視覺新技術(附論文)
    這篇論文提出了用一個全新的自上而下(top-down)的精煉方法來增強前饋網絡並進行圖像分割。通過這種簡單、快速、高效的方法,這篇論文展示了本周第 14 屆歐洲計算機視覺會議(European Conference on Computer Vision(ECCV))將在阿姆斯特丹召開。