從視頻片段中推斷樓層平面圖 新AI研究令人大開眼界

2021-01-12 比特網

平面布置圖對於可視化空間、規劃路線和溝通建築設計非常有用。例如,一個進入新建築的機器人可以使用平面圖快速感知總體布局。創建平面圖通常需要一個完整的布局,這樣3D傳感器和攝像機就可以捕捉到整個空間。

1月11日消息,據外媒報導,近日,來自Facebook、德克薩斯大學奧斯汀分校和卡內基梅隆大學的研究人員正在探索一種人工智慧技術,利用視覺和音頻,從一個短視頻剪輯中重建一個平面圖。

研究人員斷言,音頻提供了空間和語義信號,補充了圖像的映射能力。他們說,這是因為聲音天生是由物體的幾何形狀所驅動的。聲音從表面反射回來,揭示了房間的形狀,遠遠超出了相機的視野。從遠處聽到的聲音,甚至是多個房間之外的聲音,可以揭示自由空間的存在,聲音物體可能存在。此外,從不同方向聽到的聲音暴露了基於這些聲音所代表的活動或事物的布局。例如,淋浴的聲音可能暗示著浴室的方向,而微波爐的聲音則暗示著廚房的方向。

研究人員的方法被稱為AV-Map,旨在將帶有多通道音頻的短視頻轉換成2D樓層平面圖。機器學習模型利用音頻和視覺數據序列來推理樓層平面圖的結構和語義,最終使用解碼組件融合音頻和視頻信息。AV-Map生成的平面圖大大超出了視頻中直接可見的區域,顯示了劃分為離散語義房間標籤(如家庭房間和廚房)的自由空間和被佔用區域。

該團隊在來自Matternet3D和SoundSpaces數據集的數字環境中試驗了兩種設置,即主動和被動。在第一個實驗中,使用一個虛擬攝像機在模型房屋的房間內移動時發出一種已知的聲音。在第二種情況下,只依賴家中物體或人自然發出的聲音。

研究人員表示,在未來的工作中,將計劃考慮擴展多層平面圖,並將繪圖想法與機器人連接起來,主動控制攝像頭。

相關焦點

  • 吳博:目標檢測集成框架在醫學圖像 AI 輔助分析中的應用 | AI 研習...
    醫學圖像分析中目標檢測任務的普遍性,使得開發目標檢測集成框架顯得必要。近日,在雷鋒網 AI 研習社公開課上,深圳市宜遠智能科技有限公司負責人吳博剖析了目標檢測已有的框架,重點分享如何對目標檢測框架進行改造,以便在醫學圖像分析中產生更好的效果。公開課回放視頻網址:http://www.mooc.ai/open/course/559?
  • 這「花花的世界」,令人大開眼界!
    >  卻花意正濃,生機盎然  昨日  2020合肥苗木花卉交易大會  正式啟幕  上千家國內外林木種苗  和花卉企業線上線下參展  在同期舉辦的  安徽省第八屆花卉博覽會上  各種奇花異草驚豔亮相  新技術
  • 李冰冰《謎巢》新片段 「魔窟蛛影」令人不寒而慄
    李冰冰《謎巢》新片段 「魔窟蛛影」令人不寒而慄  在之前發布的「蛛殺」預告片中,帶來無限殺機的史前蜘蛛只是在幾個閃現的片段中出現,就已讓不少網友看過直呼「太可怕」、「簡直毛骨悚然」。而此次曝光的最新片段則更為全面細緻地一展這些地下「主宰者」的真容。從眼睛到肌膚的紋理,甚至細緻到每一根毛髮,全部清晰逼真,更增添一絲神秘和驚悚。
  • 新研究結合視覺和聽覺進行情感預測
    據該模型背後的研究人員稱,該模型採用了一種新的體系結構,通過在短語音片段中有效地增加信息的使用,使其適合於短片段說話人的識別。雖然在完整的語音片段中表現出了微弱的優勢,這也是研究人員打算在未來的工作中進行研究的,但是UtterIdNet在增強短片段語音識別方面有很大的潛力。
  • 明日之後建築圖平面設計分享 建築圖平面構思圖紙
    明日之後防拆建築設計圖紙分享,房子為4級家園,佔地5*6,樓層高度為3層。房子設計上考慮到了迷宮、陷阱、防拆地板,一共3個陷阱房,4處陷阱掉落點。
  • 建築平面圖怎麼看?教你這樣看圖,新手也能秒懂
    今天來教大家識讀建築平面圖,我們簡稱為平面圖,通過看平面圖可以了解建築的布局情況,下面我們一起來學習吧。一、形成與用途用一水平剖切平面,將房屋沿窗臺以上適當部位剖切開來,對剖切平面以下部分所作的水平投影圖。平面圖通常用1:50、1:100、1:200的比例繪製。
  • 視頻教學:向量代數與空間平面、空間直線內容小結與典型問題分析
    本文視頻為高等數學《向量代數與空間解析幾何》章節前面部分內容的總結,主要內容涉及如下一些內容:空間直角坐標系的建立及注意事項向量相關的基本概念:點、向量、向徑、自由向量、方向角、方向餘弦、模、單位向量及單位化等三個主要的向量運算:數量積、向量積、混合積的計算方法,運算律,幾何意義和應用
  • 用AI製作的動畫遭宮崎駿批評,研究人員選錯畫風?(附視頻)
    11月,日本NHK電視臺播出了宮崎駿最新紀錄片《宮崎駿--永不停歇的人》,視頻裡一組研究人員向宮崎駿展示他們用AI製作出的動畫怪物。看完後,宮崎駿表示「這讓我噁心,這是對生命本身的侮辱。」從演示視頻中,我們看到,裡面的「殭屍」形象令人生畏,確實與宮崎駿以往的怪物風格不一致。宮崎駿說這讓他想起自己一位身患殘疾的朋友,「有一段時間,他連跟人擊掌都很困難。我無法認為這個動畫是有趣的,製作這個動畫的人可能沒有考慮過疼痛是什麼。」在社交網絡上,網民分為兩派,一方贊同宮崎駿,認為其說出了真話。
  • Facebook AI 正在升維突破:教AI像人類一樣理解三維世界
    這對 AI 的圖像理解能力提出了極高的要求,因為它必須知道如何判斷景深,搞清楚對象位於照片的前景還是背景中,甚至要在一定程度上推斷出缺失部分的樣子。 圖 | 將視頻中的沙發和椅子三維化(來源:Facebook)
  • 7張圖讓你大開眼界,最後一張極為詭異
    今天,小磊就和大家分享7張視覺圖,這7張圖會讓你大開眼界,漲知識,尤其是最後一張圖,極為詭異,讓我們一起來欣賞一下吧。(文章最後有彩蛋哦)第1張圖:會動的靜態圖這是一張靜態圖,眾所周知,一般情況下,靜態的圖是不可能會動的。
  • 《復聯4》新片段曝光,班納見到了黑寡婦,開口愛稱令人動容!
    《復聯4》新片段曝光,班納見到了黑寡婦,開口愛稱令人動容!哈嘍小夥伴們大家好啊,小編在這裡又和大家見面了。相信大家都聽說了《復聯4》這部電影作品重做的消息,雖說只是在原有的劇情上新增了七分鐘的刪減劇情,但依舊是有很多影迷朋友們對此好奇不已。
  • 住在馬路邊 樓層高噪音大還是樓層低噪音大?
    東南網11月13日訊 (海峽導報記者 朱黃/文 陳巧思/圖)城市高樓越來越多,很多人喜歡住高層,因為視線好,而且認為離馬路比較遠,可以減少噪音影響。   近日,不少市民反映購買了樓層高的住宅,但入住之後,卻發現「住得越高,感覺越吵」。噪音與樓層關係究竟如何?
  • 戶型平面圖要怎麼看?各種符號需要注意
    由於現在很多房屋都是以期房的形式來出售的,購房者如果選擇購買期房的話,在看房的時候就看不到房屋實際的樣子,只能根據戶型圖來進行選房,但是我們看戶型圖的時候也不能只看一部分,對於房屋方方面面的問題都應該了解清楚,才能選擇一套適合自己的房屋,那麼戶型平面圖要怎麼看?
  • 「幾何深度學習」受愛因斯坦啟示:讓AI擺脫平面看到更高的維度
    新智元導讀】卷積神經網絡(CNN)已在平面視覺任務上大顯身手,但遇見不規則曲面,其效果往往大打折扣。高通和阿姆斯特丹大學提出的「規範等變卷積神經網絡」成功突破了平面的限制,將CNN的視覺能力提升了一個維度,讓AI站的更高,看得更遠。戳右邊連結上 新智元小程序 了解更多!
  • 抖音被曝秘密開發換臉功能,視頻加水印防作偽
    ,可以讓人把自己的臉換入其他視頻中的人身上。要想使用新的換臉功能,抖音及其海外版TikTok都要求用戶對自己的臉進行多角度生物掃描,然後將其添加到想要的視頻中,並將自己的臉覆蓋在視頻中某人的身上,最後進行分享。
  • 彗星軌道的新研究表明地球軌道所在的黃道平面可能不是太陽系中唯一的主要準星
    (神秘的地球uux.cn報導)據cnBeta:一項關於彗星軌道的新研究表明,地球軌道所在的黃道平面可能不是太陽系中唯一的主要準星。日本職業與環境健康大學助理教授Arika Higuchi通過追蹤長周期彗星距離太陽最遠的點,表明可能存在第二個「空黃道」對準平面。「空黃道」指的是原本是空的,但後來被彗星填充的平面。我們知道如果觀測太陽系,最明顯的一個事實是,太陽系中的所有東西幾乎都或多或少地位於黃道平面,也就是地球軌道形成的平面。除了彗星之外,其他行星、小行星以及其他一切事物的軌道都在這個平面的幾度之內。
  • 視頻質量評估的新方式:VMAF百分位數
    正文字數:4964 閱讀時長:7分鐘在這篇博客文章中,我們介紹了一種新的基於計算視頻多方法評估融合(VMAF)百分位數的視覺質量評估方法。作者 / Adeel Abbas在Twitter上,我們希望通過即時加載的、不會意外停止且始終看起來清晰的視頻為客戶提供一個令人愉悅的視頻體驗。
  • 專家在南極冰下發現「新世界」,並充滿了神秘色彩,看完大開眼界
    南極被稱為地球上的最後一片淨土,這裡的溫度極低,四周都被皚皚白雪覆蓋,近年來各國不斷的有科學家來到南極實地勘測,所取得的成果也在不斷刷新著人們的認知,有專家就在南極冰層下發現了「 新世界」,裡面充滿了神秘色彩,看完大開眼界。
  • 中國農大提出同源基因推斷新策略,並構建小麥族同源基因資料庫
    Mol Plant | 中國農大研究團隊提出同源基因推斷新策略,並構建小麥族同源基因資料庫來源 | Mol Plant2020年9月23日,中國農業大學農學院小麥研究中心郭偉龍副教授作為通訊作者在Molecular Plant
  • 美到令人窒息 天鵝座星雲S106圖+視頻
    美到令人窒息 天鵝座星雲S106圖+視頻 2011年12月20日 06:00作者:袁源編輯:袁源文章出處:泡泡網原創     泡泡網數位相機頻道12月20日 [圖1]中在恆星兩極形成的區域叫做Sharpless 2-106(S106),位於天鵝座,仿佛一個翱翔在天空中如白雪般純潔的天使。