速成透視眼!利用光傳播和陰影MIT新算法還原遮擋物,鏡頭無死角

2020-12-05 大數據文摘

大數據文摘出品

來源:MIT

編譯:王轉轉、劉俊寰

在希區柯克的經典懸疑電影《後窗》中,男主因腿部受傷坐臥修養,期間只能用望遠鏡觀察鄰居的生活打發無聊時間,由此捲入一場兇殺案。

電影中男主的「觀看」被作為重要元素被反覆強調,「觀看」的內容則是被窗戶框選出來的部分生活。

有沒有一種透視法,能夠看穿牆壁等遮擋物,再現遮擋物後的人物動作呢,就像…「火眼金睛」?

當然這可不是用來窺視別人生活的,透視法的開發可以帶來很好的社會效益,比如,自動駕駛汽車可以更好地「看到」拐角處,養老中心可以提高居住的安全性,搜救隊可以提高在危險或障礙區域的導航能力……

這一切需要交給計算機視覺(computer vision)模型來處理,現在的CV模型已經能完成一些看似不可能的任務了,比如幫助撲滅加利福尼亞的野火、了解複雜而險惡的道路,甚至可以用影子看到拐角處。

七年前,MIT研究人員就開發了一個成像系統,該系統能以地板、門和牆壁為「鏡子」,「看到」人眼視線之外的場景信息。

系統利用了一種叫做飛秒雷射(femtosecond laser)的裝置,這種裝置能發出非常短的光脈衝,持續時間以百萬分之一秒為單位。工作時,系統向對面的牆壁發射雷射,光線從牆上反射到室內,然後反彈重新出現,最終擊中一個探測器。該裝置可以每隔幾皮秒,或萬億分之一秒進行測量,由此形成一個完整的物體信息。

可以說,這項工作為未來的計算機視覺發展開闢了無限的可能。

最近,MIT計算機科學與人工智慧實驗室(CSAIL)的科學家重啟了這項工作。與之前不同的是,他們利用的是一種新方法,即通過細微的陰影和反射重現被遮擋的動作。也就是說,打開攝像機之後,即使是攝像機視野之外的物體或動作,也可以進行再現。

MIT的研究員們基於視域外的視頻投射在附近物體上的陰影,預測出視域外的內容。上面一行顯示的是研究員使用這種方法重現的視覺元素,下面一行則是原始物體。

通過觀察陰影和幾何圖形之間的相互作用,新的算法可以預測光在場景中的傳播方式,即「光傳輸」。然後,再利用這種傳播方式從觀察到的陰影中估計被隱藏的內容,甚至可以構建真人表演的大致輪廓。

雜物如何成為「觀看」的鏡子

該技術是「被動的」,這意味著對場景沒有雷射或其他幹預,整個過程需要大約兩個小時的處理時間。研究人員表示,該技術最終有助於重現視線之外的場景,包括但不限於上述應用。

「通過使用非視距成像設備(例如雷射器)可以完成許多任務,但是在我們的方法中,只能使用自然到達相機的光線,並嘗試充分利用這些稀缺的信息,」前CSAIL博士後和NVIDIA現任研究科學家,新技術的首席研究員Miika Aittala表示, 「鑑於神經網絡的最新進展,這似乎是一個很好的時機,可以解決在這個領域以前被認為是無法解決的一些挑戰。」

為了捕獲這些看不見的信息,團隊使用了細微的間接照明提示,例如被觀察區域雜亂的陰影和高光。在某種程度上,一堆雜物的行為有點像針孔照相機,類似於在小學科學課中可能會製作的東西:它阻擋了一些光線,但允許其他光線通過,並且無論在何處,它們都描繪出周圍環境的圖像。

但如果針孔相機被設計為僅允許通過足以形成可讀圖像的光線,那麼一堆雜亂的雜物會產生無法識別的的圖像、(通過光傳輸)被擾亂的陰影的複雜運動。

可以將雜物想像成一面鏡子,使我們可以看到周圍的環境,尤其是在無法直接看到的角落。這個算法所解決的挑戰是要弄清並理解這些照明的提示。

具體而言,目標是通過光傳輸和隱藏視頻,將隱藏場景中活動恢復為人類可觀看的內容。但是,解密卻被證明是一個經典的「先有雞還是先有蛋」的問題。為了理解加擾模式,用戶將需要知道隱藏的視頻,反之,為了知道隱藏的視頻,用戶將需要理解加擾模式。

「從數學上來說,就像我告訴你我正在考慮兩個秘密數字,它們的乘積是80。你能猜出它們是什麼嗎?也許40和2?還是371.8和0.2152?對於我們的問題,我們在每個像素上都面臨類似的情況,」 Aittala說,「幾乎所有隱藏的視頻都可以通過相應的加擾來解釋,反之亦然。如果我們讓計算機進行選擇,它只會為我們提供一大堆看起來什麼都不像的隨機圖像。」

考慮到這一點,團隊致力於通過算法上指定一種與現實中的陰影相對應的「加擾」模式來消除歧義,以重現隱藏的視頻,看起來它具有邊緣,以及移動時具備一致的對象。

新的算法有助於消除歧義

該團隊還利用了一個令人驚訝的事實,即使從未受過訓練的神經網絡自然也喜歡表達「類似圖像」的內容,這有助於消除歧義。

算法使用了機器學習中「深層圖像優先級」的概念,同時訓練兩個神經網絡,這兩個神經網絡僅專用於一個目標視頻。一個網絡產生加擾模式,另一個網絡估計隱藏的視頻。當這兩個因素再現了從混亂中錄製的視頻時,網絡就會得到「獎勵」,驅使它們用合理的隱藏數據來解釋觀察結果。

為了測試該系統,團隊首先將物體堆放在一堵牆上,然後放映視頻或在對面的牆上移動自己的物理位置。由此,他們可以重現視頻,使您可以大致了解房間隱藏區域中正在發生的運動。

將來,該小組希望提高系統的整體解析度,並最終在不受控制的環境中測試該技術。

相關焦點

  • 牆面也能變鏡子,只看影子就能還原視頻,MIT新算法讓攝像頭無死角
    最近MIT人工智慧實驗室(CSAIL)開發出的算法可以做到:而真實的視頻是這樣的:算法還原的結果只是模糊了些,但已經能猜出視頻的大致內容了。有了這套算法,就可以通過觀察視頻中陰影和幾何圖形之間的相互作用,預測出光在場景中的傳播方式,然後從觀察到的陰影中估計隱藏的視頻,甚至看出人的輪廓。
  • 新冠檢測新方法:MIT用咳嗽聲診斷無症狀感染者,準確率達100%
    有數據顯示,世界50%新冠(COVID-19)病例由無症狀感染者傳染。無發燒、乏力、頭暈等明顯特徵的無症狀感染者,已在不知不覺中成為新冠病毒傳播和復發的最大威脅。近日,麻省理工學院(MIT)研究團隊聲稱其利用AI開發了一種無症狀感染檢測新方法。有意思的是,該方法利用的是人的生物特徵——咳嗽聲。
  • 你見過,同時利用光和陰影來發電的太陽能電池嗎?
    就像太陽能電池一樣,照在矽上的光會激發其電子。但是,通過添加金層,當設備的一部分處於陰影中時,陰影效應能量生成器會產生電流。由Swee Ching Tan博士領導的研究小組將該裝置稱為陰影效應能量發生器(SEG),詳細解釋其原理的論文發表在《 能源與環境科學》雜誌上。
  • AI技術加持色彩還原,揭秘紫光展銳圖像算法
    人類進入智慧型手機時代後,攝影方式也發生了巨大變化:用來拍照的不再只是鏡頭和傳感器了,背後還加載著一系列的圖像算法,它可以用更快的速度處理圖像,並獲得更好的拍攝效果。好作品只能依賴專業攝影師的時代過去了,圖像算法引入到手機拍照應用後,讓人人拍出好照片成為可能。
  • Facebook用「SLAM+實時光流」實現AR真實遮擋效果
    所以,大多數AR效果都是純粹的疊加層,無法實現真實的對象遮擋效果。針對這種情況,Facebook提出了一種新穎算法,其可以將稀疏深度實時傳播至每個像素。生成的深度圖在時間空間方面十分平滑,但在深度邊緣顯示出明顯的不連續性。這使得AR效果可以與真實場景完全交互並被其遮擋。
  • 深入剖析:屋頂光伏系統陰影計算(一)
    如果設計不合理或考慮不周全,在電站運行期間,遮擋物會對系統的發電量帶來很大影響,因此有必要在設計環節經過專業的陰影遮擋分析,確定實際可安裝的陣列面積,力求最大限度降低建築陰影帶來的損失。  目前陰影分析的方法有多種,最常見的有儀器測量法(如陰影分析儀)、理論公式計算法、軟體模擬法和AutoCAD法等。
  • 利用陰影發電的太陽能電池
    北極星太陽能光伏網訊:陰影遮擋對光伏組件發電量的影響高達90%?能利用陰影發電的光伏電池問世了。4月15日,科學雜誌《能源與環境科學》報導了一款能夠利用「陰影效應」發電的光伏電池。一個來自新加坡國立大學材料科學與工程系以及新加坡國立大學物理系的團隊創造了一種叫做陰影效應能量發生器(SEG)的裝置,它利用照明和陰影區域之間的照明對比來發電。
  • 屋頂系統陰影計算方法的深入剖析(一)
    目前分布式屋頂光伏系統主要還依賴於建築為主,其主體對象最常見的為彩鋼瓦和水泥屋頂,這些屋面可能存在一定高度的女兒牆或天窗,甚至屋頂周邊存在高大建築物,而這些客觀條件一般都很難改變,但我們可以在屋面勘察環節了解當前建築屋面和遮擋物的相關數據及未來屋頂周邊是否有高大建築物的規劃等,並通過主觀設計來避免建築物的陰影遮擋問題。
  • 【科普】光伏電站的陰影遮擋源有哪些?對收益影響大不大?
    戶用光伏網訊:在自家屋頂建設光伏電站發電如今已經成為了一種流行趨勢,但是光伏電站發電量的多少直接影響到個人的收益,而陰影遮擋是非常常見的影響發電量的問題之一。那麼,陰影遮擋對發電量的影響到底有多大呢?今天就帶大家一起來看看吧!
  • 陰影遮擋對光伏發電量影響有多大?(看完震驚了!)
    據測算顯示,光伏系統中存在的微乎其微的樹蔭及電線陰影,可導致電站發電量低約20-30%!當前農村戶用和工商業屋頂建設光伏電站發電如今已經成為了一種流行趨勢,光伏電站發電量的多少直接影響到最終收益,而陰影遮擋是非常常見的影響發電量的問題之一。光伏陰影遮擋不可小覷那麼,陰影遮擋對發電量的影響到底有多大呢?
  • 新冠檢測新方法:用咳嗽聲診斷無症狀感染者,準確率達100%
    有數據顯示,世界50%新冠(COVID-19)病例由無症狀感染者傳染。無發燒、乏力、頭暈等明顯特徵的無症狀感染者,已在不知不覺中成為新冠病毒傳播和復發的最大威脅。近日,麻省理工學院(MIT)研究團隊聲稱其利用AI開發了一種無症狀感染檢測新方法。有意思的是,該方法利用的是人的生物特徵——咳嗽聲。
  • 無懼手機拍照高挑戰!紫光展銳圖像算法精確穩定,具備廣泛適用性
    人類進入智慧型手機時代後,攝影方式也發生了巨大變化:用來拍照的不再只是鏡頭和傳感器了,背後還加載著一系列的圖像算法,它可以用更快的速度處理圖像,並獲得更好的拍攝效果。
  • 「特異功能」擁有了透視眼,就等於擁有了一切
    堪比送悟空的火眼金睛說到透視眼,我們會想到孫悟空的「火眼金睛」。看穿世界險惡,妖魔怪鬼,在俄羅斯就有這麼一位擁有「透視眼」的小女孩,她叫娜塔莎焦姆基娜。娜塔莎小時跟鄰居家的普通小孩沒什麼區別,並無特異功能,只是十分聰明伶俐。
  • 探索未知世界,內窺式廣角微距攝影鏡頭解析
    從光學來看,放大倍率m=像距v/物距u,套入高斯成像公式1/f=1/v+1/u可以延展得到m=f/(u-f)=(v-f)/f,進一步求到u=(1+1/m)f,v=(1+m)f,不難看出當放大倍率提升時,v變大而u變小,這也就意味著對於一般鏡頭來說,微距設計往往意味著鏡頭與被攝物間距很短,也同時意味著機身和拍攝者更加靠近被攝物,這對於容易受驚擾的被攝物,或空間受限的拍攝環境來說是個很具體的問題。
  • 室外直射光下拍攝,不同的光線創作手法不同
    室外自然光是指以太陽為光源的照明條件,主要是指直射光和散射光。所謂直射光是指太陽沒有被雲霧和空間中的戒介質遮擋,直接把光線投射到地面上,人們清晰能夠看見太陽的位置,直射光中的景物和物體有明顯的受光面,陰影面和投影。
  • 遠方遮擋對電站發電量的影響!
    北極星太陽能光伏網訊:part1什麼是遠方遮擋?光伏電站的陰影主要是分為近場陰影和遠方陰影兩大類,近陰影是距離光伏方陣較近的遮擋物,可能會對光伏方陣產生局部性的遮擋。遠方陰影主要是距離光伏區較遠,一般10倍於光伏場區,且遮擋物本身體積較大,比如城市的高樓、山脈,對光伏場區的遮擋範圍較大,可能整個場區都被不同程度的遮擋。目前大部分光伏電站的設計主要考慮的是近陰影遮擋給方陣排布帶來的影響,一般會根據軟體來計算從而有效避開陰影遮擋區域,但是對於某些項目,如果說存在了遠方遮擋,還是有必要去考慮下對輻照量和發電量的影響。
  • 攝影用光之光線的種類與造型效果
    無論是自然光線還是人造光線,按照不同質地都可以分為直射光、散射光和反射光3類,而在直射光中,根據不同方向又可以分為正面光、前側光、側光、側逆光和逆光5種。在利用這些有趣的光線進行拍攝前,首先要了解它們的不同特點。
  • 全屋WiFi無死角 裝修就要考慮到
    很多人不太清楚5G到底和自己有什麼關係?其實關係非常大,從手機到生活、再到整體工業的運作方式都會發生天翻地覆的變化。 今天來聊下,家庭裝修中需要考慮到的一個關鍵問題:就是怎麼才能讓房間裡的每個空間WiFi信號都滿格?做到全屋WiFi無死角,這需要在裝修時就要根據實際情況考慮清楚,整個居家空間的網絡布置問題。以往,裝修對網絡信號的設置往往都不合理。
  • 黑洞如何將光圍繞自身彎曲,從而形成發光光暈和黑洞「陰影」
    從這種氣體和其他地方發出的光子在事件視界外的黑洞周圍循環,這是無返回點。這些光子勾勒出事件地平線的圓形輪廓,產生圖像中所示的發光光暈和黑洞「陰影」。輪廓的明亮光暈的內邊緣稱為光子環。它標誌著最黑的電路光可以在黑洞周圍形成,而不會刺入黑洞。愛因斯坦的廣義相對論可以預測圓環的大小和形狀,許多人都稱讚M87圖像是對愛因斯坦引力的驗證。