用大數據監視森林火災和非法砍伐
4月16日的《科技縱覽》提醒列表(IEEE Spectrum Alert)發表一篇文章,介紹將大數據用于環境保護,科研人員開發了一個新的森林映射工具,當大片森林被砍伐、被破壞時,工具將對監視者發出聲響警告。這引起了我的興趣。
這個由世界資源研究所開發的、名為Global Forest Watch(全球森林監視)的在線工具,將大數據處理技術應用于衛星圖像,能夠隨時發現森林采伐和受損的情況。用戶通過它,可以探索全球地圖,發現自2000年以來森林的變化趨勢,同時可以考察森林情況,其精度可達30米。該地圖的熱帶區域每16天更新一次。用戶可以選擇“警報”功能,即當系統偵察到非法采伐或者森林火災時將第一時間對你發出警報。
當森林中一棵大樹倒下,計算機將發出一個警告,給環保人士、研究人員和環境政策制定者。這事看似容易,實則不易。要從雜亂無章的特殊格式的衛星數據里找到那塊特定的森林,然后從圖像上識別出剛剛倒下的那棵樹,隨即要實時發出警告推送給相關人員——這其中技術難點很多。
Global Forest Watch由谷歌地圖引擎提供技術支持,由美國NASA和美國地質調查局的幾顆衛星提供圖像數據。此前,谷歌開發了一個平臺,集中了千萬億字節的地球科學數據,向研究人員開放,讓他們可以用簡單直接的方式來使用這些數據。谷歌地球引擎高級開發人員David Thau說:“用戶只要登錄、取出這些數據、運行他們自己的算法就可以了。”谷歌地球引擎現在已經有數以千計的研究伙伴。
而谷歌森林監視是一連串項目研究成果的集成。世界資源研究所的數據實驗室早就有一個熱點地區森林警報系統,基于NASA兩個衛星Terra和Aqua上的中等分辨率的分光輻射度計所測量的數據運行。美國馬里蘭大學一位地理科學Matthew Hansen教授與谷歌地球引擎合作,將NASA和美國地質勘探局的幾個地球資源衛星,用于全球森林監視。前者能夠提供較好的時間分辨率,而后者則可以提供很好的空間分辨率。
2008年,美國地球資源衛星數據可以自由使用了。每30米一個像素點,一共1430億個像素點,Hansen每月每年跟蹤這些點,發現根據季節的不同,它們的特征會呈現出正常的變化。Hansen的合作者于2013年11月發表了一個對剛果2000年至2012年消失的150萬平方公里森林的報告,他們在10000臺計算機上計算了一百萬CPU核小時。在云計算中,研究人員要考慮計算任務在整個網絡中的分布,而地球引擎的研究者只要用一個程序接口進入他們的問題,就能夠實現自動并行化,十分簡便易行。為了建造公用的全球森林監視網站,世界資源研究所計劃讓大眾都能取得這些大數據,希望政府部門、商業界、研究人員和各種利益團體都能用這個工具,以得到森林管理的較好圖像。
通過這個報道,我有幾點感想:
一、大數據在這里得以應用決定于三要素:衛星、David Thau和Matthew Hansen。衛星提供數據,David Thau開發平臺,Matthew Hansen做數據分析。
二、衛星是要用的。我們經常聽到我國衛星發射成功的消息,卻很少聽到衛星被用上了的消息。我們的衛星發射技術的確已經過關,而且已經商業化。我們自己也發射了許多衛星。但是,較少聽到衛星做了什么用、對國民經濟起了什么作用、衛星數據可以供研究人員自由使用。
三、大數據的研究一定要有實際用處。用大數據做森林監視就是一個很好的實例。每年我國森林火災和非法砍伐時有發生,如果能實現自動監測,并且實時給相關人員推送警示,那該多好??!可要實現這一步,還有許多工作要做——IT人員要提供工具,方便專業人員處理這些數據;專業人員要研究他們自己的算法作出各種監視的判斷。這真不容易?。?/p>