AI尋寶!女博士用YOLOv3造沉船探測器,杰克船長:我錯過了100億
有沒有興趣來個水下探險?
玩一次就可以財務自由的那種。
人類航海史最早可以追溯到新石器時代。
在漫長的歲月中,由于天氣、戰爭等各種原因,無數船只沉入海底。加上近代人類在航空技術上的進步,又有不少航空器由于各種原因葬身水下。
這些長眠于海底的船只、飛機以及其他物件有些在航行過程中攜帶了大量的金銀珠寶,有些則由于其自己特殊的歷史價值令人趨之若鶩。
比如在大航海時代沉沒的這艘「阿托卡夫人」號,在1985年被發現時,船上共有超過40噸、價值超4億美元的寶藏。
發現它的梅爾·費舍爾也因此走上了財務自由之路。
但顯然下海找船這件事并不是誰都能搞定。
潛入深海需要價值不菲的專業設備和人員。這倒是其次,更重要的是:
你可能根本就不知道沉船在哪。
海下沉船是一筆寶貴的公共財產,因此,國家政府機構自然就承擔起了挖掘和保護的重任。
在美國,1995年成立的海軍歷史與遺產司令部(NHHC)水下考古分部承擔著美國在世界各地海底長眠的2,500 多艘沉船和 15,000 多架飛機殘骸的開發和保護工作。

而這其中先找到這些水底殘骸的位置至關重要。
不久前,NHHC與美國德州大學開展了一項研究,通過計算機視覺系統從遙感圖像中找到并確認殘骸。
通過測試美國和波多黎各海岸的遙感圖案,準確率達到了92%。
研究介紹
作者使用Python完成了所有建模,并在ArcGIS Pro中完成了地理空間分析。
用TensorFlow支持的Keras運行深度學習模型,GPU用的是NVIDIA 1080 GEFORCE GTX。
訓練數據集
訓練數據包括已確認沉船的GPS定位和相關的測深數據。
測深數據從美國國家海洋和大氣管理局 (NOAA)數據訪問(NOAA’s Data Access Viewer)中獲取,由分辨率為1米的激光雷達和多波束聲納產生。
沉船GPS坐標通過NOAA的沉船和障礙物數據庫(AWOIS)獲取。

美國沉船數據庫--交互式地圖
沉船訓練數據中包含163艘沉船,研究人員通過增強沉船數據,得出額外247個不同的沉船圖像。
總訓練數據集包括410艘沉船,410個區分沉船和地形的背景地形圖塊;而測試數據集則額外含有40艘沉船和40個背景地形圖塊,無數據增強。
以YOLOv3為架構的模型
作者用ArcGIS Pro從高程數據(elevation data)中得出山體陰影,以png格式導出包含沉船的山體陰影圖塊,再用微軟的Visual Object Tagging Tool標記。
檢測精度極高,檢測速度也飛快,所以研究人員用Joseph Redmon的卷積神經網絡單次檢測器模型YOLOv3為模型架構,具體應用是基于qqwweee的keras-yolo3和AntonMu的TrainY ourOwnYOLO這兩個GitHub存儲庫開發。
YOLOv3網絡框架分為兩個組件:特征提取器和檢測器。

輸入到特征提取器之前,每個圖像會自動調整為416 × 416像素。
YOLOv3使用的Darknet53能夠輸出三種不同規模的圖像到檢測器中,檢測器會輸出最合適的邊框,包括預測的邊框中心點、寬度和高度、置信度和類別標簽。
該模型使用遷移學習,權重在ImageNet1000數據集上進行了預訓練。
模型輸出的圖像里標示出沉船的邊框和預測的置信度分數。


上圖為模型輸出的聲納或激光雷達山體陰影圖像,標識的邊框為預測的沉船位置和預測置信度分數。
精確度指標
模型性能的精確度指標包括接收器操作特征曲線 (AUC-ROC)、精確率-召回率曲線(precision-recall)、總體準確率、召回率、準確率和F1分數。
一般來說,AUC-ROC分數在0.7到0.8之間是可以接受的,0.8以上為優秀,0.9以上為優秀。

AUC-ROC曲線圖
模式與數據分析
為了尋找沉船位置和形態的模式,作者列出了箱線圖和直方圖,用單向方差來分析。
計算得出緊鄰沉船區域的參數后,與模型訓練中使用的背景地形值進行比較。
參數包括坡度、曲率(描述坡度的整體形狀)、曲率剖面(平行于最大坡度方向)、曲率平面(垂直于最大坡度方向)、殘骸面積、殘骸到岸距離、沉船深度等。
研究結果
模型的AUC-ROC得分為0.945,其它各項指標得分如下圖。

模型的AUC精確率-召回率得分為 0.901。

AUC精確率-召回率得分
和數據集中的背景地形圖相比,沉船明顯具有更高的斜率值和曲率值。

與背景地形比較沉船的 (a) 最大斜率、(b) 曲率、(c) 曲率剖面和 (d) 曲率平面的箱線圖。
F比率和p值表示,與背景地形相比,這些參數中的每一個都傾向于共享不同的沉船值范圍。

所有沉船與背景地形參數的F比率和p值(alpha= 0.05)
作者假設沉船到殘骸可見度可能與沉船的保存狀態相關,在海水中分解得越多的沉船看起來越不呈矩形。
但這個假設需要實地驗證,因為很多因素影響沉船的狀態,包括沉船時間、氧氣情況和湍流等環境條件。
作者還假設沉船能見度可能會受到海水透明度的影響。
為了驗證這一假設,作者創建了一個水清晰度等級,并使用以ArcGIS為底圖的光譜衛星圖像,對每個沉船位置的水清晰度進行評估。

但由于90%以上的沉船都位于不透明的水域中,這一假設并不成立。
研究總結(太長不看版):
1. 分辨率為3米的激光雷達和多波束聲納偶爾也能檢測出殘骸,但分辨率為1米的效果更理想。
2. 僅有不到10艘沉船能夠輕易識別出來,大部分沉船僅表現為地形異常。
3. 沉船檢測除了受到測深數據的空間分辨率外,還受到水深和海水清晰度的影響。

清晰的沉船殘骸

箭頭所示為不太清晰的沉船殘骸
結論
作者通過研究驗證了將AI用于水下考古的可能性——提出的深度學習的模型檢測出水底沉船精度為0.92,能夠有效檢測出沉船殘骸。
未來通過更大、更多樣的訓練數據集,可以進一步提高模型性能和泛化能力,從而開辟了新的海洋探索方法。
不僅如此,這套訓練好的系統已經可以從新的數據中來預測沉船或者飛機的方位,并且還能夠適配于其他格式的數據,比如多光譜圖像。
總之,有了AI,科研部門可以更快、更準地發現海底沉船了。
作者簡介
論文一作Leila Character是德州大學奧斯汀分校的在讀博士。她專注于使用機器學習和遙感圖像來識別考古和自然特征。
她可謂是一個跨界研究學者,將AI應用于跨度非常大的專業中,尤其是考古學在學術界堪稱是一片「藍海」。
這項研究的模型還能夠在預測世界不同地區陸地和水下不同類型的考古特征之間快速、輕松地切換。
為此,她還將通過這項研究來尋找古瑪雅考古建筑、瑪雅考古遺址的洞穴和羅馬尼亞墓葬的項目。