最聰明玻璃誕生:以光散射為核心算法,無需耗電,可識別數字

2020-12-05 DeepTech深科技

這大概是世界上最聰明的一塊玻璃,它可以用來識別數字,並且無需耗電,也不用傳感器,只要光亮即可

這個玻璃 AI 研究將人工智慧嵌入了一個非計算機的物理裝置中,自帶科幻色彩。它能夠實時區分手寫數字,也就是說,一塊小小的玻璃實現了傳統 AI 的相機、傳感器和深度神經網絡的功能整合。當數字變換時,系統能及時作出反饋。

該研究來自威斯康星大學麥迪遜分校電子及計算機工程系副教授喻宗夫(ZongFu YU)團隊,研究以封面形式發表在 7 月 8 日的光學期刊 Photonics Research 上。

圖 | 從左到右分別為:喻宗夫、Ang Chen 和 Efram Khoram。他們開發了這款智能玻璃。 (來源:SAM MILLION WEAVER)

核心算法:光的散射

光學神經計算最重要的特點是,幾乎不消耗能量,且因其有內在的並行性可大大加快計算速度。與此前光學神經計算不同,喻宗夫團隊的研究沒有遵循數字神經網絡架構,也不採用分層前饋網絡,而是利用光學反射連接各個激活單元。正是這種光反射作為反饋機制,從而導致了豐富的波動結果。

這是一種無需分層的連續人工神經計算系統。這套系統利用了特意嵌入玻璃中的石墨烯和小氣泡。當目標圖像的光線穿過玻璃 AI 時,其路徑就會被這些氣泡和石墨烯反射或折射而造成彎曲,彎曲後的光線會聚焦到玻璃另一側 10 個點中的某個點上。

圖丨玻璃 AI 的原理。(a)傳統的人工神經網絡架構,其中信息只能向前傳播; (b)玻璃 AI 系統的光學神經網絡,採用通過具有線性和非線性散射體的光進行神經計算。(來源:喻宗夫)

圖丨玻璃 AI 的工作過程。(a)系統經過訓練以識別手寫數字,輸入波將圖像編碼為光能強度分布。(b)數字 2 的兩個樣本。 可以看出,兩個 2 的光能場分布不同,但是它們被識別為 2。(c)兩個 8 的光能場分布不同,它們都被識別為 8。(來源:喻宗夫)

這 10 個點對應了從 0 到 9 這 10 個數字。就像一把鑰匙開一把鎖,如果某個數字的光線沒有對焦到相應的數字,研究者就調整系統中的雜質大小和位置。研究者對此進行了成千上萬次訓練,最終玻璃 AI 學會了精確的數字對應。即使手寫數字風格不同,這套系統也能準確聚焦、識別。

這是一種以簡單結構獲得複雜行為表現的研究。在機器學習的過程中,研究人員訓練的是物理材料,而不是數字代碼。也就是說,光傳播的波動力學實現了人工神經計算的功能。相對於數字計算,這是顛覆性的觀念。

研究人員認為,這套系統在現實中的應用還不確定,但理論上可以製作成生物識別鎖,進行人臉識別。只是這個系統還缺乏計算上的靈活性,以及面對多線程或不同的任務

顯然,這個玻璃 AI 看起來和我們此前認識的 AI 系統不一樣,它為何會被稱為 AI 系統?這個系統有人臉識別的潛力嗎?研究者下一步會如何開發這個系統?帶著諸多問題,DeepTech 專訪了作者喻宗夫。

模糊識別很難,是 AI 的體現

DeepTech:能不能介紹你們課題組的工作內容以及你們的研究目標?利用光來做 AI 系統,這個思路是怎麼產生的?

喻宗夫:我們希望在納米光學技術和機器學習的交叉口創新,希望對光敏材料、傳感器件、光學成像系統和機器學習全棧優化。以前硬體和軟體的研究比較分立,我們希望把軟硬體看作一個整體,以具體應用為目標導向,從新整體考慮視覺感知。在這個大方向下面,我們組成員們展開思路,不拘泥於現有光感、成像、識別的架構體系,於是 Erfan 和其他組員就想出了這個點子。

DeepTech:與其他的光計算相比,你們這個研究是怎樣的特點?

喻宗夫:以前的光計算本質上還是數字計算,只是把電子換成了光子,從電路改成了光路。用光作為載體來計算有幾十年歷史了,這次我們利用的是結構材料本身特性

首先第一點,我們的玻璃 AI 不存在以前神經網絡的分層概念,它整個就是一體化的。另外,我們整個優化方法的過程也不是按照模擬數字神經網絡的思路,而是優化麥克斯韋方程,去控制光的物理散射過程。

從實現的結果上來說更不一樣。就是說我這個裝置可以做得非常小,也不需要用任何能量,因為以前的結構需要分層,體積和能耗就比較大。

DeepTech:這個玻璃 AI 看起來和我們此前認識的 AI 系統不一樣,它為何會被稱為 AI 系統?能不能說,這只是一套數字密碼系統?

喻宗夫:模式識別是典型的 AI 應用。這和密碼系統完全相反,我們需要這個玻璃有很大的容錯性:一個數字誰來寫,都要認出來,這種模糊識別很難,是 AI 的體現。 相反,密碼則要一個比特也不能差,卻容易實現多了。

DeepTech:這個 AI 系統與計算機是什麼關係呢?該系統的訓練學習過程是一個調整玻璃內石墨烯雜質的過程,而不是其他 AI 系統那樣在計算機輸入數據、在終端輸出結果那樣的過程,對嗎?

喻宗夫:光在玻璃裡面傳播就是一個偏微分方程控制的波動過程,而神經網絡和偏微分方程有很大的相似性。我們利用這種相似性,以波動方程為載體實現神經網絡的計算效果。

光打到玻璃裡的小孔上,就會被散射開。小孔就像數字神經網絡裡的節點,它們把輸入混合起來,產生輸出。我們這個訓練過程,就要去做和神經網絡一樣的梯度下降,去調整玻璃裡面的小孔和非線性材料的位置與大小。

DeepTech:這個思路很出奇,做出這樣的系統需要哪些研究基礎呢?

喻宗夫:其實做這個事情需要很多領域的配合。我們不是僅僅把數字改換成光子,我們還要去解電磁場方程。所以對機器學習、電磁場方程這兩塊領域都要熟悉。 我們希望在這個交叉領域繼續研究創新。

DeepTech:似乎這個 AI 系統不需要那麼巨量規模的訓練,是這樣理解嗎?

喻宗夫:不是,我們也需要很多訓練。因為這個是在電磁場介質裡面傳播,我們要仿真整個電磁場傳播的過程,然後在這個基礎上要對偏微分方程整體做優化,所以計算量其實是非常大的。我們用的是機器學習的方法,但解的是電磁場的優化問題,所以這兩塊結合起來很有挑戰,需要從頭寫整個訓練工具。

一個新的概念

DeepTech:這個研究是一個怎麼定位?是技術的突破,還是說創造了一個新的工具?

喻宗夫:我覺得這是一種新的概念。我們是用玻璃本身來實現人工智慧的計算,而以前的人工智慧都是用計算機完成的,那麼現在是利用非數字模擬的物理作用就可以實現這件事情,所以說在這方面是一個突破。如此引申的話,很多其他物理作業比如聲波也可以這樣操作。

DeepTech:能說這是一個計算機嗎?

喻宗夫:對。通用的計算機可以做很多事情,我們這個系統只能做一件事情,所以在這一點上它跟計算機是有差別的。但是目前來說,計算機的發展也漸漸地趨向於只做一件事情。比如說挖比特幣的礦機。

我覺得,這個不是為了取代已有的圖像識別系統,更多的可能是一些更廣闊、以前沒有應用的方式。比如說,雖然說我們現在有了數字鎖,但是沒電或者斷網就不能用。我們這個人臉識別鎖就像傳統物理鎖,只要有鑰匙它就一直可以用。

所以可能是在這種更加特殊的時候,如果你擔心 AI 系統被攻擊的話,那麼這個系統完全沒有可能從外界去攻擊或幹擾,它對安全性很有保障

DeepTech:除了數字識別,這個系統如果用來開發人臉識別的話,還需要做哪些工作?以及其挑戰有多大?

喻宗夫:人臉識別在概念上的可行性已經可以通過現在的工作證明。人臉識別的應用需要不少工程工作,可能超出一個學術問題了。比如訓練的樣本的光場建模需要大量的計算。

DeepTech:你們下一步會如何開發這個系統?這個系統將來如何能便捷應用到普通民眾中,能成為一款可攜式的智能產品嗎?

喻宗夫:這個概念為我們自己打開了一個思路:不一定要有數字和晶片才能智能。智能可以無所不在,我們稱之為物理驅動智能。 我們今天證明玻璃可以識別圖像,就是麥克斯韋電磁場定律賦予的。還有很多物品可以利用物理定律的來智能化。

數字晶片是人類的智能產品,物理定律的智能產品一定更廣闊。我們覺得利用物理來做智能計算很有意思,而且有廣泛的應用價值。

專家點評:

阮智超(浙江大學物理學系教授):本研究原創性較高,與 2018 年一篇 Science 研究有異曲同工之妙,後者創造了一種 3D 列印的全光學衍射深度神經網絡架構。在喻宗夫研究中,如要應用到如人臉識別等複雜場景,需要進行複雜的調參,這對於這種玻璃 AI 裝置有挑戰性。

喻宗夫簡介:

喻宗夫(ZongFu YU),威斯康星大學麥迪遜分校電子及計算機工程系副教授。2004 年本科畢業於中國科學技術大學物理學系,博士畢業於美國史丹福大學,主要研究領域是微納光子學、機器視覺和新能源。他是非互易納米光子學開創人之一,提出了納米太陽能電池的效率理論,並開發了多模視覺相機,應用於下一代的機器視覺。

(感謝清華大學計算機系自然語言處理實驗室副教授劉知遠對本文提出意見。)

-End-

參考:

https://www.osapublishing.org/prj/abstract.cfm?uri=prj-7-8-823

https://www.newscientist.com/article/2208975-ai-made-from-a-sheet-of-glass-can-recognise-numbers-just-by-looking/

https://news.wisc.edu/simple-smart-glass-reveals-the-future-of-artificial-vision/

相關焦點

  • 動態光散射技術入門及儀器採購指南
    本文中,馬爾文儀器公司產品營銷經理Stephen Ball將向您介紹DLS的工作原理,並就購買光散射系統時的關注事項為您並提供一些專業建議。   通過觀察散射光,可以測定粒子分散體系或分子溶液的特性,如粒度、分子量和zeta電位。光散射系統充分挖掘利用這些特性之間關聯,並在近幾十年間經過不斷完善,目前已經能為常規實驗室應用提供高度自動化的檢測。
  • 人臉識別核心算法及技術解析
    並通過直方圖之間的相似度匹配技術(如直方圖交運算)來實現最終的人臉識別。在FERET四個人臉圖像測試集合上與FERET97的結果對比情況見下表。由此可見,該方法具有良好的識別性能。而且LGBP方法具有計算速度快、無需大樣本學習、推廣能力強的優點。
  • 物聯網後向散射系統的誕生與技術原理之探討
    後向散射(backscatter)系統給我們提供了新的解決思路,該系統「裁剪」了耗電的射頻電路部分,編碼、調製節點感知的信息從反射的信號中傳遞出去,並將這一過程的能量消耗降低至微瓦級,這點能耗假如可以從環境中獲得的話,沒有電池的無源物聯網就不再是夢想了。後向散射的思想誕生源於一場情報刺探事件1945年,前蘇聯把一枚木雕的美國國徽送給了美國大使。
  • 貨櫃號碼識別核心在手持設備中應用,方便、快捷
    每一個公司的貨櫃都有一個自己專用的、根據一定規則生成的號碼,一般為前四位為字母,後六位為數字,最後一位為數字校驗位。 貨櫃號碼是在全世界範圍內識別貨櫃的唯一標誌,因此也成為海關、碼頭、堆場、港區、貨運、物流管理中最基本的依據之一。
  • 調光玻璃-調光玻璃簡介,原理特點及作用調光玻璃使用問題及檢測
    調光玻璃簡介智能調光玻璃是兩層玻璃之間夾著一層液晶膜(俗稱調光膜, PDLC film),液晶膜由PVB膜覆蓋在最中央,然後置於高壓釜或夾膠爐經過高溫高壓的過程膠合而成。智能調光玻璃除了具備隱私保護功能,同時具備所有安全玻璃的應用特性。
  • 養花時常聽到散射光,散射光到底是什麼意思?
    散光是相對於直射光而言,太陽光的照射,包括直射光和散射光。光是光合作用的能量來源。光照充足,光合作用就旺盛,養分積累多,植物生長就良好。直射光就是直接照射於植物上,散射光就是隔著窗臺,玻璃,有一定的阻礙物,但能透過光線,光線相對於直射光而言發散,較弱的光照。花放在大棚陽臺玻璃櫃下都叫接受散光。陽性花卉一般需要直射光,中性或陰性花卉只需要散光。1、陽性花卉這種花卉喜光向陽性強,需要直射光。
  • 雷射光散射譜儀測量原理
    雷射光散射譜儀是一種多用於物理學領域的測試儀器, 它包括靜態光散射和動態光散兩大功能。靜態光散射可以測定高聚物分子 量、均方半徑和第二維裡係數等重要數據。動態光散射可測定溶液中大分子或膠體質點的平 動擴散係數及流體力學半徑。測定高分子的相對分子質量一般採用靜態光散射的原理。
  • 全新升級核心算法技術,虹膜識別進入高速時代
    作為虹膜識別產業的核心技術領導者,武漢虹識技術有限公司7月4日正式宣布推出全新第三代虹膜識別核心算法技術PhaseIris 3.0,基於第三代算法的硬核晶片Qianxin 3在100MHz主頻下單核編碼速度小於50ms(超過20幀/每秒),單核比對時間僅為320納秒(每秒312.5萬次比對)。
  • 最大規模光量子晶片誕生,一枚「玻璃片」為量子計算提速
    新華社記者 丁汀攝    一個個肉眼看不見的單光子穿過透明的「玻璃片」,幾秒之後,顯示屏幕上呈現出單光子的二維量子行走演化結果。  一個量子計算過程完成,而其中最關鍵的就是這枚「玻璃片」。在燈光下,從某個角度看去,這枚完全透明的「玻璃片」上隱約閃現幾道光譜。
  • 日本將全息圖計算速度增加55倍 實現汽車擋風玻璃3D導航
    此種方法比傳統算法快56倍,而且不需要採用耗電的圖形處理單元(GPU),而只需在普通的PC計算核心上運行,這為研發緊湊、節能的增強現實設備開闢了道路,如汽車擋風玻璃和眼鏡上的3D導航設備。也就是說,除了用於最明顯的應用:3D顯示屏之外,該技術無處不在。無需特殊眼鏡的3D顯示屏還沒得到普及,而虛擬實境(VR)技術等先進技術大多都依賴光學技巧,讓人眼相信看到了3D的物體,但是這並不是總具有可行性,也限制了應用範圍。其中的一個原因是生成3D物體的全息圖是一項計算繁重的工作,因而每次計算都很慢且耗電,當想要展示實時變化的大型3D圖像時,會被嚴重限制。
  • 基於光散射的完美光器件
    例如半導體光刻系統,用於製造更小、更節能的微晶片,基於衛星的高解析度地球觀測系統,以及引力波探測領域的基礎研究。然而,在光學領域,即使是最微小的缺陷也會導致散射光,從而導致對比度降低和光產率降低。因此,當今的光學系統依賴於優化設計和全面檢查光學元件的整個表面。為了實現這一目標,夫琅和費應用光學和精密工程研究所(IOF)正在開發能夠檢測不需要的散射光的光散射測量技術。
  • 谷歌量子計算改進圖像分類,微美全息5G核心算法助力AI視覺發展
    工作研究人員說,這是為了說明量子力學教科書可以揭示人工智慧問題,認為最大的可實現的分類精度,如果一個算法必須做出決定後發現第一個「量子」的光(即光子)通過液晶屏幕顯示一個圖像從一個數據集。MNIST,最經典的計算可以完成的是檢測一個落在圖像像素上的光子,然後通過將每張圖像的亮度重調到一個單位和來從光強分布中猜測數字。
  • 什麼是直射光、什麼是散射光?沒有直射光養什麼花比較好?
    萬物生長靠太陽,植物的養護離不開太陽的光照,喜歡養花的人,都知道我們在談論光照時,會經常提到兩個詞:直射光與散射光。有些花卉需要充足的直射光照環境,而有些需要散射光的養護環境。那麼什麼是直射光,什麼是散射光呢?
  • 基於STFT濾波算法的指紋圖像識別系統的設計與實現
    關鍵詞:指紋增強;二值化;特徵提取;指紋圖像識別;圖像處理 引言 作為最重要的生物識別技術之一,指紋識別技術已經被廣泛應用與門禁、考勤、身份驗證等領域。指紋識別系統是由指紋圖像採集、指紋圖像增強、指紋圖像二值化、指紋圖像細化、指紋圖像特徵提取和指紋圖像匹配等模塊所構成的模式識別系統。
  • 新算法可識別與疾病相關基因
    新算法可識別與疾病相關基因 2020-12-02 04:54:47 責任編輯:張奧林 2020年12月02日 04:54 來源:科技日報參與互動   新算法可識別與疾病相關基因
  • DENSS:直接從溶液散射數據確定電子密度
    作者:Thomas D Grant翻譯:劉廣峰摘要:Grant利用新穎的迭代結構因子檢索算法,從溶液散射數據無需建模而直接計算電子密度。該算法對12種不同生物大分子的實驗數據進行了驗證,可以應用於各種各樣的分子系統。
  • 數字的反烏託邦:算法是如何懲罰窮人的?
    由於人工智慧、預測算法、風險建模和生物識別技術是背後的驅動力,因此只有數學家和計算機科學家能夠完全理解這個巨大的變化。但如果你正處於福利改革接收端的數百萬弱勢人群之中,你一定會體會到其中嚴重甚至是致命的影響。
  • 【備考事業】彩虹到底是光的散射還是光的折射?
    玻璃、大氣中的氧氣和高空中的臭氧層,對紫外線都有很強的吸收作用,能吸收掉太陽光中的大部分紫外線,因此能保護地球上的生物,使它們免受紫外線傷害。(2)紅外線紅外線是波長介乎微波與可見光之間的電磁波,波長在750納米至1毫米之間,是波長比紅光長的非可見光。覆蓋室溫下物體所發出的熱輻射的波段。透過雲霧能力比可見光強。
  • 珠海霧化玻璃 調光玻璃 通電玻璃 電控玻璃
    膠合調光玻璃淋浴房的出現告訴我們更安全的淋浴房產品消費未來的發展趨勢。層壓調光玻璃的抗壓強度和抗衝擊性能是鋼化玻璃的5倍。註:調光玻璃(層壓調光玻璃)由兩片玻璃組成,EVA膜和調光膜。液晶薄膜在兩個玻璃之間固化。調光玻璃的調光原理是:在自然狀態下,內部液晶的排列是不規則的,液晶的折射率低於外部聚合物的折射率,入射光在聚合物中散射,呈乳白色。
  • 散射光檢測可不是我們想像的那麼簡單
    FSC反映細胞大小,SSC