光學預處理與CV結合,UCR學者用漩渦實現混合計算機視覺系統

2020-12-24 機器之心Pro

機器之心報導

作者:杜偉、小舟

在本文中,來自加州大學河濱分校機械工程系的研究者通過應用光學漩渦證明了混合計算機視覺系統的可行性。該研究為光子學在構建通用的小腦混合神經網絡和開發用於大數據分析的實時硬體方面的作用提供了新見解。

從醫學診斷到自動駕駛再到人臉識別,圖像分析在現代技術中無處不在。使用深度學習卷積神經網絡的計算機徹底改變了計算機視覺。但卷積神經網絡(convolutional neural network,CNN)通過從預訓練數據中學習來對圖像進行分類,然而這些數據通常會記住或發展某些偏見。此外,數據還易於受到對抗性攻擊(以極細微且幾乎察覺不到的圖像扭曲出現)的幹擾,從而導致做出錯誤的決策。這些缺點限制了卷積神經網絡的用途。

提升圖像處理算法能效和可靠性的一種方法是將常規計算機視覺與光學預處理器結合起來。這種混合系統可以用最少的電子硬體工作。由於光在預處理階段即可完成數學函數而不會耗散能量,因此使用混合計算機視覺系統可以節省大量時間和能源。這種新方法能夠克服深度學習的缺點,並充分利用光學和電子學的優勢。

今年 8 月份,在一篇發表於 Optica 的論文中,加州大學河濱分校機械工程系助理教授 Luat Vuong 和博士生 Baurzhan Muminov 通過應用光學漩渦(具有深色中心點的旋繞光波),證明了混合計算機視覺系統的可行性。光學漩渦可以比喻為光繞著邊緣和角落傳播時產生的流體動力漩渦。

論文連結:https://www.osapublishing.org/optica/fulltext.cfm?uri=optica-7-9-1079&id=437484

研究表明,光學預處理可以降低圖像計算的功耗,而電子設備中的數位訊號識別相關性,提供優化並快速計算可靠的決策閾值。藉助混合計算機視覺,光學器件具有速度和低功耗計算的優勢,並且比 CNN 的時間成本降低了 2 個數量級。通過圖像壓縮,則有可能從存儲和計算複雜性兩方面大幅減少電子後端硬體。

Luat Vuong 表示:「本研究中的漩渦編碼器表明,光學預處理可以消除對 CNN 的需求,比 CNN 更具魯棒性,並且能夠泛化逆問題的解決方法。例如當混合神經網絡學習手寫數字的形狀時,它可以重建以前從未見過的阿拉伯或日語字符。」

該論文還表明,將圖像縮小為更少的高強度像素能夠實現極弱光線條件下的圖像處理。該研究為光子學在構建通用的小腦混合神經網絡和開發用於大數據分析的實時硬體方面的作用提供了新見解。

論文內容簡述

深度學習卷積神經網絡通常涉及具有較高計算成本的多層、前向 - 後向傳播機器學習算法。所以,在本文中,研究者展示了卷積神經網絡的替代方案,該方案從其光學預處理、傅立葉編碼模式中重建原始圖像。該方案對計算的需求少得多,並且具有更高的噪聲魯棒性,因此適用於高速和弱光照條件下的成像。

具體而言,該研究引入帶有微透鏡陣列的漩渦相位變換,以及淺層密集的「小腦」神經網絡結合。單次編碼孔徑方法利用了傅立葉變換螺旋相位梯度的相干衍射、緊湊表徵和邊緣增強。使用漩渦編碼可以訓練小腦對圖像進行去卷積操作,其速度比使用隨機編碼方案快 5 至 20 倍,且在存在噪聲的情況下獲得了更大的優勢。

一旦訓練完成,小腦就可以從 intensity-only 的數據中重建對象,從而解決了逆映射問題,而無需在每個圖像上執行迭代,也無需深度學習方案。通過漩渦傅立葉編碼,研究者在 15W CPU 上以每秒幾千幀的速度重建以低光通量(5nJ / cm^2)照明的 MNIST Fashion 對象。最終,研究者證明了使用漩渦編碼器進行傅立葉光學預處理在達到相似準確率的情況下,速度比卷積神經網絡快 2 個數量級。

漩渦的知識可以擴展為理解任意波型。當帶有漩渦時,光學圖像數據會以突出顯示並混合光學圖像不同部分的方式實現傳播。研究者指出,使用淺層「小腦」神經網絡進行的漩渦圖像預處理(僅需運行幾層算法)就可以代替 CNN 發揮作用。

Vuong 還表示:「光學漩渦的獨特優勢在於其數學和邊緣增強功能。在本文中,我們證明了,光學漩渦編碼器能夠以類似於一種小腦神經網絡從其光學預處理模式快速重建原始圖像的方式生成目標強度數據。」

方法

圖 1 描述了該研究的成像方案,其中對象 F(r,Φ) 的多個圖像被收集到傅立葉域中:透過每個微透鏡的光由不同的漩渦和透鏡 mask 模式 M_m(r,Φ) 調製;攝像機檢測到菲涅耳(Fresnel)傳播、漩渦傅立葉變換(vortex-Fourier-transformed)強度模式的縮放模平方圖像。

其中,m 是漩渦拓撲電荷,r 和Φ是實域柱面坐標,而 u 和 v 是傅立葉平面笛卡爾坐標。漩渦傅立葉強度模式 F^~ 集中在相對較小的區域中,但隨著 m 的增加,通常會呈越來越寬的甜甜圈形(圖 1(b))。對象「實域」中的漩渦相位在空間上編碼並破壞了傅立葉變換強度模式的平移不變性,如圖 1(c) 所示。

此外,該研究將一些小圖像數據集視為對象輸入,並比較 F(r,Φ) 中的不同表徵。對於每個正實值數據集圖像 X,相位變化的映射如下公式所示:

其中,α_0 是對象相位移動的動態範圍。這種映射很方便,因為信號功率不隨選擇的 X 改變。研究者還考慮了 X 閉塞或吸收信號時不透明對象,即,這會產生相似的趨勢。

歸根結底,該研究有三項主要創新:(1)用漩渦透鏡進行光譜特徵的邊緣增強;(2)在沒有相似學得數據集的情況下對圖像進行快速逆重建;(3)取決於層激活的抗噪聲能力。

感興趣的讀者可以閱讀論文原文,了解更多研究內容。

參考連結:https://news.ucr.edu/articles/2020/12/11/optical-pre-processing-makes-computer-vision-more-robust-and-energy-efficient

相關焦點

  • 光學預處理與計算機視覺結合,UCR學者用漩渦實現混合計算機視覺系統
    在本文中,來自加州大學河濱分校機械工程系的研究者通過應用光學漩渦證明了混合計算機視覺系統的可行性。該研究為光子學在構建通用的小腦混合神經網絡和開發用於大數據分析的實時硬體方面的作用提供了新見解。從醫學診斷到自動駕駛再到人臉識別,圖像分析在現代技術中無處不在。使用深度學習卷積神經網絡的計算機徹底改變了計算機視覺。
  • 計算機視覺系統怎樣剖析「看到」的一切?
    本文將引導你完成搭建計算機視覺系統的一些主要步驟。計算機視覺系統的標準工作流程是:· 一組圖像進入系統。· 為了對這些圖像進行預處理並提取特徵,使用特徵提取器。· 機器學習系統利用提取的特徵來訓練模型,並做出預測。下面將簡要介紹數據可能在這三個不同步驟中的一些主要過程。圖像進入系統在嘗試實現計算機視覺系統時,需要考慮兩個主要組件:圖像採集硬體和圖像處理軟體。
  • 計算機視覺(圖像)技術:視覺圖像搜索綜述
    接口安全易用,而且跨平臺做的相當不錯,是一個不可多得的計算機圖像及視覺處理庫。  其次,Python的語法更加易用,貼近自然語言,極為靈活。;3)利用大規模學習技術,開發能勝任計算機視覺領域各類任務的最先進的模型。
  • 機器視覺系統設計的關鍵技術
    機器視覺系統是綜合現代計算機、光學、電子技術的高科技系統。機器視覺技術通過計算機對系統攝取的圖像進行處理,分析其中的信息,並做出相應的判斷,進而發出對設備的控制指令。機器視覺系統的具體應用需求千差萬別,視覺系統本身也可能有多種不同的形式,但都包括以下過程: 圖像採集 利用光源照射被觀察的物體或環境,通過光學成像系統採集圖像,通過相機和圖像採集卡將光學圖像轉換為數字圖像,這是機器視覺系統的前端和信息來源。 圖像處理和分析 計算機通過圖像處理軟體對圖像進行處理,分析獲取其中的有用信息。
  • 南京大學繆峰團隊在「垂直結構」新型類腦視覺系統方面取得重要進展
    海歸學者發起的公益學術平臺 分享信息,整合資源 交流學術,偶爾風月 視覺系統是人類用來觀察並認知外部世界的最重要的感覺系統
  • 光電混合計算機運用
    光計算機的優勢已為科學家們所共知,但是,在計算機中如何使用光,科學家們卻有著千差萬別的設想。從利用光的方式看,光計算機可以分為全光計算機和光混合機兩類。全光計算機的信息輸入、輸出以及邏輯元件的動作皆是藉助於光進行的,而光電混合機則是由光學元件和電子元件混合組成的計算機。
  • PyTorch實現,GitHub4000星:微軟開源的CV庫
    機器之心報導編輯:魔王、陳萍本文介紹了微軟開源的計算機視覺庫,它囊括了計算機視覺領域的最佳實踐、代碼示例和豐富文檔。近年來,計算機視覺領域突飛猛進,在人臉識別、圖像理解、搜索、無人機、地圖、半自動和自動駕駛方面得到廣泛應用。而這些應用的核心部分是視覺識別任務,如圖像分類、目標檢測和圖像相似度。
  • 人工智慧與計算機視覺
    因為它有很多應用,很多技術是從計算機視覺誕生出來以後,再反運用到AI領域中去。  第三, 計算機視覺擁有大量的量子AI的應用基礎。  計算機視覺技術的原理  計算機視覺就是用各種成象系統代替視覺器官作為輸入敏感手段,由計算機來代替大腦完成處理和解釋。
  • 智能圖像處理 讓機器視覺及其應用更智能高效
    具有智能圖像處理功能的機器視覺,相當於人們在賦予機器智能的同時為機器按上了眼睛,使機器能夠「看得見」、「看得準」,可替代甚至勝過人眼做測量和判斷,使得機器視覺系統可以實現高解析度和高速度的控制。而且,機器視覺系統與被檢測對象無接觸,安全可靠。
  • 「垂直結構」新型類腦視覺系統方面取得重要進展
    傳統機器視覺採用攝像頭和計算機的組合架構,雖然一定程度上實現了對人類視覺系統部分功能的模擬,但是要想達到能與人類視覺系統相比擬的高效信息處理能力,仍面臨很大的挑戰。,提出和實現了「垂直結構」的類腦視覺系統,為未來實現類腦機器視覺提供了一個可行的思路。
  • 五年後的計算機視覺會是什麼樣?和CV先驅們一同暢想(上) | CVPR 2019
    這幾年來,計算機視覺領域的已有問題在研究者們的努力下普遍得到了越來越好的解決,映入大家視野的新問題也越來越多。不過到了 CVPR 這個供全球計算機視覺研究者齊聚討論的盛會上,一個可能不那麼直接指導短期研究、不那麼容易形成共識問題也就自然地湧上了大家的心頭:在五到十年後的未來,計算機視覺的研究會是什麼樣子,是深度學習幾乎完全替代了目前還在使用的其他一些方法,還是我們應該期待新的革命?
  • 南大繆峰團隊在"垂直結構"新型類腦視覺系統方面取得重要進展
    傳統機器視覺採用攝像頭和計算機的組合架構,雖然一定程度上實現了對人類視覺系統部分功能的模擬,但是要想達到能與人類視覺系統相比擬的高效信息處理能力,仍面臨很大的挑戰。近日,南京大學物理學院繆峰教授團隊將視網膜形態傳感陣列和憶阻交叉陣列結合為一體,提出和實現了「垂直結構」的類腦視覺系統,為未來實現類腦機器視覺提供了一個可行的思路。
  • 一文全覽深度學習在計算機視覺領域的應用
    (2-D)還有計算機視覺的預處理(2-D)。以前做移動端的視覺平臺,有時候不得不把一些圖像處理功能關掉,原因是造成了特徵畸變。現在CNN這種天然的特徵描述機制,給圖像預處理提供了不錯的工具,它能將圖像處理和視覺預處理合二為一。
  • 華人AI界痛失「一代宗師」,計算機視覺之父黃煦濤先生去世
    大數據文摘出品美東時間2020年4月25日夜間,華人計算機視覺一代宗師Thomas S.Huang(黃煦濤)在去世,享年84歲。由於他在圖像處理、模式識別等計算機視覺領域作出的開創性貢獻,黃煦濤也被華人計算機界譽為「計算機視覺之父」。
  • 人工智慧---計算機的視覺與語音技術
    計算機視覺的歷史可以追溯到1966年,人工智慧學家Minsky在給學生布置的作業中,要求學生通過編寫一個程序讓計算機告訴我們它通過攝像頭看到了什麼,這也被認為是計算機視覺最早的任務描述。到了七八十年代,隨著現代電子計算機的出現,計算機視覺技術也初步萌芽。人們開始嘗試讓計算機回答出它看到了什麼東西,於是首先想到的是從人類看東西的方法中獲得借鑑。
  • 曾獲計算機視覺最高獎項,人工智慧學者朱松純加入北京大學
    圖片來源:北京大學新聞網芥末堆訊,9月24日,北京大學人工智慧研究院工作會議召開,會上宣布,世界頂級的人工智慧研究學者據量子位消息,朱松純1986年考入中國科學技術大學計算機系,1991年取得學士學位。1992年赴美留學,4年後於哈佛取得了計算機專業碩士和博士學位。師從國際數學大師、菲爾茲獎得主、美國國家科學獎章獲得者,國際數學家協會前主席大衛·曼福德教授。其後朱松純先後在布朗大學、史丹福大學工作和任教。2002年開始,加盟美國加州大學洛杉磯分校(UCLA)任教,拿到終身教職,至今長達18年之久。
  • 機器視覺和智能圖像處理技術之間的關係
    」、「看得準」,可替代甚至勝過人眼做測量和判斷,使得機器視覺系統可以實現高解析度和高速度的控制。而且,機器視覺系統與被檢測對象無接觸,安全可靠。 1、機器視覺技術 機器視覺的起源可追溯到20世紀60年代美國學者L.R.羅伯茲對多面體積木世界的圖像處理研究,70年代麻省理工學院(MIT)人工智慧實驗室「機器視覺」課程的開設。到80年代,全球性機器視覺研究熱潮開始興起,出現了一些基於機器視覺的應用系統。
  • 輕鬆學Pytorch-使用ResNet50實現圖像分類
    Hello大家好,這篇文章給大家詳細介紹一下pytorch中最重要的組件torchvision,它包含了常見的數據集、模型架構與預訓練模型權重文件、常見圖像變換、計算機視覺任務訓練。可以是說是pytorch中非常有用的模型遷移學習神器。本文將會介紹如何使用torchvison的預訓練模型ResNet50實現圖像分類。
  • 計算機視覺已橫跨感知與認知智能
    一、計算機視覺技術概述   計算機視覺橫跨感知與認知智能,現階段應用以感知為主   視覺使人類得以感知和理解周邊的世界,人的大腦皮層大約有70%的活動在處理視覺相關信息。計算機視覺即通過電子化的方式來感知和理解影像,以達到甚至超越人類視覺智能的效果。
  • 成功構建混合量子系統,量子計算機更近一步
    來源:Burrus/NIST美國國家標準與技術研究所(National Institute Of Standards And Technology)的物理學家通過將帶電原子和帶電分子連接或「糾纏」,加強了他們在量子水平上對分子基本性質的控制,展示了一種構建混合量子信息系統的方法,該系統可以操作、存儲和傳輸不同形式的數據。