來源:HyperAI超神經
本文約2600字,建議閱讀9分鐘本文為你分享迄今為止規模最大、質量最高的自然災害衛星圖像數據集。
標籤:自然災害 數據集
[ 摘要 ]麻省理工學院在最近 ECCV 2020 上提交的一篇論文中,發布了一套自然災害圖像數據集。這是迄今為止規模最大、質量最高的自然災害衛星圖像數據集。
2020 年,多災多難的一年。年初爆發的疫情,夏天南方的洪災,近期美國加州的野火……
洪災、山火、地震之類的自然災害,總是威脅著人們的生命財產安全。而在無法避免其發生的情況下,如果能夠及時、迅速地發現一些細微的變化,就能更好地制定相應救援方案,更合理地進行資源配置,同時也有助於進行相關新聞的報導。
因此,麻省理工學院的工程學碩士生 Ethan Weber 和合作者 Hassan Kan,在最新論文《Building Disaster Damage Assessment in Satellite Imagery with Multi-Temporal Fusion》(《具有多時相融合的衛星影像中的建築物災害破壞評估》)中提出了一個深度學習模型,能夠對受損區域的衛星圖像進行更快、更精準的評估,從而為急救人員爭取更多的時間、最大程度地減少損失。
該論文在近期 CV 頂會 ECCV 2020 上發表
論文地址:https://arxiv.org/pdf/2004.05525.pdf
與此同時,他們還發布了一個最新的用於損壞評估的衛星圖像數據集,讓圖像事件檢測的相關研究更進一步,研究人員能實現更精確的定位和量化損失。
用 AI 與時間賽跑:加速災情評估
對於自然災害,現場應急小組減少反應時間,迅速響應、採取行動,對於減少損失和挽救生命至關重要。此外,為了更好地在受災地區部署資源,應急人員必須了解損失的確切位置和嚴重性,這些同樣重要。
目前,應急人員通常通過人力觀察衛星圖像的方法,來評估災害損壞程度,但評估過程可能要花費數小時之久,這對於搶救工作極為不利。
人員觀察分析衛星圖像耗時耗力
是目前自然災害評估工作中的一個瓶頸
Ethan Weber 的這項研究貢獻在於,創建自動分析圖像的工具,減少圖像分析時間,贏得與時間的賽跑。
另外,其研究通過共享權值的 CNN(卷積神經網絡),獨立地提供災前和災後圖像,可以獲得更好的性能。
他們還提出了一種新的計算機視覺模型,該模型能夠檢測在 Twitter 和 Flickr 等社交媒體平臺上發布的圖片中的事件。
論文中提出的建築損壞預測、評估模型架構
標記 19 種自然災害的 22068 張圖像
除了提出新模型外,該研究團隊還重磅發布了一個新的事件數據集:xBD 數據集。
該數據集包含 22068 張圖像,標記有 19 種不同的事件,包括地震,洪水,野火、火山爆發和車禍等。這些圖像包括了災前、災後圖像,圖像可用於構建定位和損傷評估這兩項任務。
颶風災前圖像(左圖)與災後圖像(右圖)
據介紹,xBD 數據集是迄今為止第一個建築破壞評估數據集,是帶注釋的高解析度衛星圖像中規模最大、質量最高的公共數據集之一。其基本信息如下:
xBD Dataset發布機構:MIT包含數量:22068 張圖像數據格式:png數據大小:31.2GB更新時間:2020 年 8 月下載地址:https://hyper.ai/datasets/13272
這些圖像解析度為 1024×1024,其中每個建築物都有標識符,並在災前災後圖片中保持一致。
但研究者發現建築物的解析度往往太小,模型無法準確繪製建築物邊界。為此,他們在 4 張 512×512 的圖像上訓練和運行模型,形成左上角、右上角、左下角和右下角象限。
根據這些災前和災後數據,損傷評估可以被定義為單時間和多時間任務。在單時間設置中,只有災後圖像被輸入模型,該模型必須預測每個像素的損傷水平。在多時間背景下,災前災後圖像都被輸入到模型中,該模型必須在後圖像上預測損傷程度。
團隊綜合多方資料,制定的損壞評估量表
數據集從何而來?
團隊表示,這套新數據集旨在填補該領域的空白。現有數據集的圖像數量和事件類別的多樣性都受到限制。
作者還解釋了如何創建數據集、如何創建模型以檢測圖像中的事件,以及如何過濾嘈雜的社交媒體數據中的事件。
他們的其中一項工作是,過濾了 4000 萬張 Flickr 圖片,來尋找災害事件。另外一些工作則是可對地震,洪水和其他自然災害期間,發布在 Twitter 上的圖像進行過濾。
比如,該團隊將與自然災害相關的推文過濾為特定事件,並通過將推文頻率與美國國家海洋和大氣管理局(NOAA)提供的資料庫相關聯,來驗證這一過程。
Ethan Weber 說:「我對這個數據集能夠進行進一步的研究以檢測圖像中的事件感到興奮,它也非常有效地激發了人們對計算機視覺界的興趣。」
他還表示,社交媒體和衛星圖像都是有助於應急響應的數據形式。社交媒體提供實地觀察,而衛星圖像提供宏觀的觀察(expansive insights),例如確定哪些地區受野火影響最大。
每逢災害發生,網友通常會在社交媒體上發布實地拍攝照片
正是意識到這種相互聯繫,Ethan Weber 和他的校友合作,在損害評估方面做出了卓越的成績。
Ethan Weber 說:「現在我們有了數據,對定位和量化破壞很感興趣。我們正在與應急組織合作,以保持專注並開展具有現實利益的研究。」
訪問 https://hyper.ai/datasets/13127 或點擊原文閱讀,即可高速下載該數據集。
編輯:黃繼彥
——END——
想要獲得更多數據科學領域相關動態,誠邀關注清華-青島數據科學研究院官方微信公眾平臺「 數據派THU 」。