利用AI評估災害損失,為救援工作助力
地震、颶風和洪水等自然災害影響著大片地區和數百萬人,而這對于后勤救援是一項巨大的挑戰。包括政府、非政府組織和聯合國組織在內的危機響應機構,需要在災害發生后快速而全面準確的評估,以規劃如何優化配置有限的資源。為此,能提供充足信息的工具愈發重要,如分辨率高達 0.3 米的超高分辨率 (VHR) 衛星圖像,成為應對危機的重要工具,可以向危機響應機構呈現災害給地形、基礎設施和人口帶來的變化。
然而,要從原始衛星圖像中提取相關的具體信息(例如,倒塌的建筑物、出現裂縫的橋梁以及臨時避難所的位置),仍然需要大量的人工手動操作。例如,就 2010 年海地地震而言,僅在太子港地區,分析人員就人工檢查了 90,000 多棟建筑物,并以五分制對每座建筑物遭受的破壞程度進行了評估。
這類人工分析工作常需要專家團隊工作數周才能完成。而實際上災后 48-72 小時內就迫切需要這些數據,為最緊要決定的作出提供依據。
為了幫助減輕這類自然災害的影響,我們提出了“使用卷積神經網絡在衛星圖像中檢測建筑物損壞程度的方法 (Building Damage Detection in Satellite Imagery Using Convolutional Neural Networks)”,其中詳細介紹了一種機器學習 (ML) 方法,該方法可自動處理衛星數據從而生成建筑物損壞的評估數據,這由我們與聯合國世界糧食計劃署 (WFP) 創新加速器合作開發。相信這項工作將有望大幅減少危機響應工作人員進行災害評估報告所需的時間和精力,進而縮短向受災最嚴重地區及時提供救災援助所需的周轉時間,同時增加此類關鍵服務的總體覆蓋范圍。
- 使用卷積神經網絡在衛星圖像中檢測建筑物損壞程度的方法
https://arxiv.org/abs/1910.06444
方法
自動損失評估過程分為兩步:建筑物檢測和損失分類。
在第一個步驟中,我們使用對象檢測模型在圖像中為每個建筑物周圍繪制邊界框。然后,截取以每個檢測的建筑物為中心的災前和災后圖像,利用分類模型確定建筑物是否受損。
分類模型由卷積神經網絡組成,在該卷積神經網絡中輸入以給定建筑物為中心的兩個 RGB 圖像,大小為 161 像素 x 161 像素,對應 50 m x 50 m 的占地面積。模型會對比災害事件之前與之后的圖像,分析兩幅圖像中的差異,并輸出 0.0 - 1.0 范圍內的值,其中 0.0 表示建筑物未受損,1.0 則表示建筑物受損。
由于前后的對比圖像是在不同日期、一天中的不同時間拍攝,并且在某些情況下是由不同衛星所拍攝的,所以可能會出現許多不同的問題。如,圖像的亮度、對比度、色彩飽和度和照明條件可能有很大的差異,并且有時圖像中的像素可能會錯位。
為了校正顏色和亮度差異,我們使用直方圖均衡對圖像的顏色進行歸一化。我們還通過使用標準的數據增強技術(如在訓練過程中隨機干擾圖像的對比度和飽和度),讓模型對細微顏色差異更具穩健性。
訓練數據
這項工作的主要挑戰之一是收集訓練數據集。可以使用的數據存在固有限制:因為僅有少數災害才存在高分辨率的衛星圖像,并且進行災害評估的災害更是少之甚少。我們使用從事這一領域的人道主義組織(如 UNOSAT 和 REACH)手動制作且公開提供的損壞評估數據為標簽。
我們使用對應的的原始衛星圖像,然后用 Google Earth Engine 在空間上將災害評估標簽與衛星圖像結合起來,以生成最終的訓練示例。用于訓練模型的所有圖像均來自可用的商業源。
- Google Earth Engine
https://developers.google.com/earth-engine
圖塊示例:呈現了不同災害中受損和未受損建筑物的前后對比情況
結果
我們針對近年來發生的三次大地震進行評估:2010 年海地地震(7.0 級)、2017 年墨西哥城地震(7.1 級)和 2018 年印度尼西亞發生的一系列地震(5.9 - 7.5 級)。
對于每一次事件,我們都用受地震影響地區的一部分建筑物來訓練模型,并用另一地區的一部分建筑物對其進行測試。我們使用 UNOSAT 和 REACH 進行的人類專家損壞評估作為評估的基礎。我們使用實際準確率(與專家評估相比)和 ROC 曲線下的面積 (AUROC) 來衡量模型的質量,AUROC 捕捉了模型的真陽性和假陽性檢測率之間的權衡,是測試數據集中陽性和陰性樣本數量不平衡時衡量質量的一種常用方法。AUROC 值為 0.5 意味著模型的預測是隨機的,而值為 1.0 意味著模型完全準確。根據危機應對者的反饋,要在災害發生后 72 小時內做出初步決策,要求準確率必須達到 70%。
事件 | 準確率 | ROC曲線 下的面積 |
---|---|---|
2010 年海地地震 | 77% | 0.83 |
2017 年墨西哥城地震 | 71% | 0.79 |
2018 年印度尼西亞地震 | 78% | 0.86 |
根據人類專家評估數據評價模型預測(越高越好)
2010 年海地地震的模型預測示例:接近 1.0 的預測值意味著模型更確信建筑物受損。值接近于 0.0 表示建筑物未受損。閾值 0.5 通常用來區分受損/未受損的預測,但是可以對其進行調整以控制預測的敏感程度
未來工作
雖然當前模型在使用相同地區(例如,同一城市或國家)的建筑物進行訓練和測試時運行良好,但我們的最終目標是希望模型能夠準確評估世界上各地發生的災害對建筑物的損壞程度,而不僅僅局限于與訓練模型所用的數據類似的災害。
這項工作充滿挑戰,因為來自歷史災害的可用訓練數據的種類存在固有限制:僅局限于少數幾個地理位置發生的事件。因此,對我們的模型而言,泛化到新地點未來可能發生的災害仍是一個挑戰,也是我們目前的工作重點。我們設想建立一個可以由專家分析師進行交互式訓練、驗證和部署的系統,以便重要的援助分配決策可以始終得到經驗豐富的災害響應機構的核實。我們希望這項技術能讓社區在最需要的時候及時得到所需的幫助。