從視頻片段中推斷樓層平面圖 新AI研究令人大開眼界

2021-01-11 比特網

平面布置圖對於可視化空間、規劃路線和溝通建築設計非常有用。例如,一個進入新建築的機器人可以使用平面圖快速感知總體布局。創建平面圖通常需要一個完整的布局,這樣3D傳感器和攝像機就可以捕捉到整個空間。

1月11日消息,據外媒報導,近日,來自Facebook、德克薩斯大學奧斯汀分校和卡內基梅隆大學的研究人員正在探索一種人工智慧技術,利用視覺和音頻,從一個短視頻剪輯中重建一個平面圖。

研究人員斷言,音頻提供了空間和語義信號,補充了圖像的映射能力。他們說,這是因為聲音天生是由物體的幾何形狀所驅動的。聲音從表面反射回來,揭示了房間的形狀,遠遠超出了相機的視野。從遠處聽到的聲音,甚至是多個房間之外的聲音,可以揭示自由空間的存在,聲音物體可能存在。此外,從不同方向聽到的聲音暴露了基於這些聲音所代表的活動或事物的布局。例如,淋浴的聲音可能暗示著浴室的方向,而微波爐的聲音則暗示著廚房的方向。

研究人員的方法被稱為AV-Map,旨在將帶有多通道音頻的短視頻轉換成2D樓層平面圖。機器學習模型利用音頻和視覺數據序列來推理樓層平面圖的結構和語義,最終使用解碼組件融合音頻和視頻信息。AV-Map生成的平面圖大大超出了視頻中直接可見的區域,顯示了劃分為離散語義房間標籤(如家庭房間和廚房)的自由空間和被佔用區域。

該團隊在來自Matternet3D和SoundSpaces數據集的數字環境中試驗了兩種設置,即主動和被動。在第一個實驗中,使用一個虛擬攝像機在模型房屋的房間內移動時發出一種已知的聲音。在第二種情況下,只依賴家中物體或人自然發出的聲音。

研究人員表示,在未來的工作中,將計劃考慮擴展多層平面圖,並將繪圖想法與機器人連接起來,主動控制攝像頭。

相關焦點

  • 小心入了樓層平面圖的坑!
    當然,很多朋友說了:買房都會看戶型圖的,不好了肯定不要啊。是不是買房只要看戶型圖就一定能挑選到合適的房子呢?看完下面這些案例再做決定吧:【案例一:採光問題】這個戶型乍一看非常不錯,格局方正、南北通透、動靜分區、明廚明衛,住起來絕對沒毛病。
  • 買房時怎麼看戶型平面圖?樓層布局很重要
    現在房產交易市場裡面的房子大多都是期房,而購房者在選購期房的時候,只能根據戶型圖來判斷房屋戶型,但是很多購房者都不會看戶型圖,因此對於房屋本身就不太了解,在買房時也只是恍恍惚惚就做了決定,其實不管是購買新房還是購買現房,學會看戶型平面圖是非常重要的,那麼買房時怎麼看戶型平面圖?
  • 這個AI能把表情和嘴型「複製粘貼」到其他人臉上 還讓川普意外躺槍
    一個令人毛骨悚然的人工智慧將一個人的面部表情轉移到另一個人身上,製作出令人毛骨悚然的逼真的「深度假視頻」。該軟體能精確地將一個視頻片段(如角色的嘴)轉換成另一個視頻片段的樣式,以創建逼真的虛假剪輯。
  • 戶型平面圖要怎麼看?各種符號需要注意
    由於現在很多房屋都是以期房的形式來出售的,購房者如果選擇購買期房的話,在看房的時候就看不到房屋實際的樣子,只能根據戶型圖來進行選房,但是我們看戶型圖的時候也不能只看一部分,對於房屋方方面面的問題都應該了解清楚,才能選擇一套適合自己的房屋,那麼戶型平面圖要怎麼看?
  • Genome Biology 口腔中令人難以置信的細菌-研究人員仔細研究了...
    該項新研究中,出於對細菌如何花粉棲息地以及在人體內的構型充滿好奇,由哈佛大學領導的微生物生態學研究人員檢查和研究了人類口腔微生物組,發現了生活在口腔某些區域的細菌亞群的驚人變化。  內容  得力於最新的測序和分析方法,可以更好地了解口腔微生物組,提供了解決細菌群落複雜性的新方法。
  • sky光遇,萌新跑圖指南雨林平面圖
    雨林-靜謐庭院平面圖穿過精密庭院,第二個圖是雨林的螢光森林,這裡有三位深藍色的先祖點位,4個黃色的光之翼點位,20個紅色的燭火收集點,橙色的石燈和淡藍色的發光珊瑚,靠近它們都可以為你補充能量。雨林-螢光森林平面圖從A出口來到密林遺蹟,這裡有三個先祖,三個光之翼以及25處紅色的燭火收集點橙色點位的石燈和淡藍色點位的發光珊瑚可以為你補充能量。
  • 視頻轉gif怎麼轉?把視頻轉換成動態圖表情包的方法
    視頻轉gif怎麼轉?相信很多小夥伴在利用社交軟體聊天的時候都喜歡發送一些gif動態圖給對方為聊天增加些許樂趣,除此之外有趣的gif動態圖表情包也能在短時間之內迅速傳播讓人記憶深刻。那你知道怎麼把視頻轉gif把視頻中比較有趣的片段提取出來呢?
  • 產品分析報告 | 開眼Eyepetizer,精選短視頻內容社區,讓你大開眼界
    、內容社區產品Slogan:每日精選視頻推介,讓你大開眼界。在開眼APP 的用戶評價中,經常出現「沒有廣告、不花裡胡哨、視頻質量高、大開眼界、提升知識面、有營養、短視頻中的清流」等類似字眼,說明開眼APP雖然受眾小,但是內容質量高,一旦遇到合拍的用戶,留存的可能性也會更高,與此同時,保持產品初心與質量,維持用戶活躍與使用,變得更為重要。
  • 這些令人不安的照片,表明AI越來越聰明了!它正在學習根據文字生成...
    BERT 通過引入一種稱為 「masking(遮罩)」 的新技術,使模型這方面的能力得到了大幅加強。 模型會被要求完成類似下面的填空題: 這位女士去___鍛鍊。 他們買了一個___麵包做三明治。
  • 抖音被曝秘密開發換臉功能,視頻加水印防作偽
    ,可以讓人把自己的臉換入其他視頻中的人身上。要想使用新的換臉功能,抖音及其海外版TikTok都要求用戶對自己的臉進行多角度生物掃描,然後將其添加到想要的視頻中,並將自己的臉覆蓋在視頻中某人的身上,最後進行分享。
  • Facebook新專利:智能定製視頻封面
    【搜狐IT消息】7月8日消息,有國外媒體在一個月前發現了Facebook的幾項新專利,其中包括運用面部識別、地標檢測甚至音頻線索拾取等技術為視頻添加封面圖標甚至標籤。這項功能的用途一時令人有些摸不著頭腦,不過隨著Facebook在6月21日為旗下照片分享應用Instagram加入短視頻功能,答案終於水落石出——精彩的封面和準確的標籤讓視頻更容易在茫茫照片海洋中被人注意到。
  • 住在馬路邊 樓層高噪音大還是樓層低噪音大?
    東南網11月13日訊 (海峽導報記者 朱黃/文 陳巧思/圖)城市高樓越來越多,很多人喜歡住高層,因為視線好,而且認為離馬路比較遠,可以減少噪音影響。   近日,不少市民反映購買了樓層高的住宅,但入住之後,卻發現「住得越高,感覺越吵」。噪音與樓層關係究竟如何?為此,記者選取了廈門市多處高層建築,實地測試噪音。
  • 地盤分槽——古建築的平面圖
    對於上述這四句很長的術語,這裡首先解釋幾個概念:(1)「地盤分槽圖」中,「地盤」是指建築物的平面圖,而「分槽圖」即建築物的仰視平面圖,相當於柱頭部位的平面。地盤分槽圖即是以柱頭尺度為準,是平闇(即天花板)以下的結構仰視平面圖。
  • 桂林鸚鵡山崖壁上刻著宋代桂林的城市平面圖
    刻在廣西桂林市鸚鵡山崖壁上的宋代桂林的城市平面圖,高2.82米,寬2.93米,陰刻單線,詳於城防設施,略於街道坊市。桂林市在宋代稱「靜江府」,據宋章時發《靜江府修築城池記》所載,參證史籍,可知此圖應稱《靜江府修築城池圖》,刻於鹹淳八年(1272),主要內容為自寶祐六年(1258)至鹹淳八年這14年中,為防禦蒙古軍隊進攻,靜江府前後四任官員主持修築城防工事的情況。據圖所示,城分內外兩圈。內城即傳為唐李靖創建的桂州城,平面矩形,東、西、南三面各開一門,幹道呈丁字形。
  • 將視頻轉為GIF動態圖的圖文分享
    將視頻轉為GIF?因為GIF是壓縮格式的文件,用於減少文件在網絡上傳遞的時間,所以很多自媒體人都會把視頻的某一片段轉換為GIF,然後發布在公眾號平臺上。如果你也想通過視頻轉GIF創作一些有趣的動態圖,那就看下面這篇圖文分享吧。
  • 中央財經大學誕生地舊址復原平面圖和3D動畫「出爐」
    經過一年多的努力,中央財經大學(分數線,專業設置)西皇城根22號院(1949-1954)舊址復原的平面圖和3D動畫於近日完成,向學校70華誕獻上了一份厚禮。舊址復原平面圖和3D動畫生動形象地再現了學校成立初期的校址容貌、校舍布局及其功能,豐富了學校「源頭校址」的影像資料,為充實校史館的相關內容提供了重要參考。
  • 建築平面圖的圖示內容及表示方法是什麼
    問:建築平面圖的圖示內容及表示方法是什麼?答:1、注寫圖名和繪圖比例平面圖常用1:50、1:100、1:200的比例繪製。2、縱橫定位軸線及編號,定位軸線是各構件在長寬方向的定位依據。凡是承重的牆、柱,都必須標註定位軸線,並按順序予以編號。3、房屋的平面形狀、內、外部尺寸和總尺寸。
  • 教你如何截取視頻中的背景音樂或聲音片段
    有時在網上(如優酷網,騰訊視頻,迅雷看看,百度影音,愛奇藝等)播放視頻時,我們想把中間的背景音樂或對白內容截取下來,該如何操作呢?下面跟著我來操作吧。1, 在電腦上安裝並運行樓月語音聊天錄音軟體,然後點擊下圖所示菜單進入設置界面。
  • 科學家發現人類基因新缺失片段
    如今,科學家們發現,即使已經正式完成了10年的人類註解基因組,但仍然含有難以填補的缺隙,在近期在線出版的《自然—方法學》(Nature Methods) 期刊上,研究人員描述了發現這些缺失片段的一種方法,更好地反映出人類遺傳的多樣性。 通過將基因組分解成小片段的高能量技術,越來越多的人類基因組被測出。
  • AI大事件丨Paige.ai斥資將機器學習帶入癌症病理學
    /Paige.ai病理學AI引導,已經在A輪融資中獲得了2500萬美元,用於構建一個幫助理解癌症病理的系統。在這個簡短的視頻中,您將了解他們來自哪裡以及我們為什麼在ML中使用它們。在這項工作中,研究人員探索在培訓同一代理完成多個任務上挑戰。