![](https://hfnxjk.com/statics/images/logo.png)
一年多以前,國際保育組織(CI)正全力應付一個龐大的大數據問題。
非營利環保組織的使命是保護自然及其生物多樣性,但監測和分析物種的健康——尤其是在熱帶森林中有地球上一半的動植物——是一個費體力和勞動密集的過程。
在跨越四大洲的16個地方,CI已建立1000個相機陷阱網絡——當動物通過其視點區域,裝配有運動傳感器的攝像頭就會被觸發。每2000多公里設置一個站點,攝像頭捕捉經過的動物的圖像,并試圖綜合和了解氣候變化和土地利用對熱帶陸地哺乳動物和鳥類的多樣性的影響。
檢查星球的生命體征
“你和我去看醫生,我們檢查生命體征——提問,血壓,” 首席科學家CI桑迪·安德爾曼如此說道,“我們需要那些各種各樣的地球生命體征,這就是我們在國際保護組織與TEAM[熱帶生態,評估和監測網絡]和其他項目真正想做的。”
“我們所做的是制作相機陷阱,所以聽起來有點像偷拍,”她補充道,“在整個森林里制作這種陷阱,如此我們就能夠發現動物種類和動物行為。”
由于相機陷阱位于地球上一些更偏遠的地方,那些地方沒有基礎設施。團隊必須手動收集陷阱中的數據并上傳,最關鍵的是CI科學家運行一系列的腳本和模型,以確定出現在圖像中的不同品種。然后,他們融合氣候測量(降水,溫度,濕度,太陽輻射等),關于數目的數據(生長,存活,森林砍伐等等)和來自公開渠道的土地利用數據,去創造一個該區域的動物種群健康典范,并且看它們是如何隨時間而變化的。
“世界上的一切都是相互關聯的,” CI的熱帶生態評估和監測網絡代理執行主任豪爾赫·阿烏馬達說道,“自然不會存活于國家之間,而是作為一個整體而存在。如果我們維持這個世界,并且以一種聰明的方式,我們需要能夠評估自己應該如何改進并迅速作出反應。 “
但這個過程并不簡單。大約一年前,TEAM每年的能收集到一百萬張圖像數據。現在的數據已經超過200萬。他們在CI辦公室用電腦碾碎這些數據,然后手動分布許多工作。分析這些數據的進程可能需要數周,數月甚至更長時間。
“如果我們想運行我們的指標之一的迭代,就得花費幾周時間,”阿烏馬達說,“我們清楚我們必須根據代碼和問題的數據科學來做,但我們沒有足夠的規模來快速實現。”
阿烏馬達指出,時間至關重要。熱帶森林CI監控器的所在地被認為是地球上所有動植物一半的所在地,能產生地球上40%的氧氣。但根據聯合國環境規劃署稱,46萬公頃的熱帶森林 ——約18000平方英里——正在逐年消失。
當陷阱數據仍然必須手動收集時,惠普幫助CI進行快于原來9倍的數據分析,并且能做到更準確地引導。惠普企業服務軟件工程師建立了野生動物圖片指數(WPI)分析系統,一個可視化人性化的項目儀表盤和分析工具,可近實時數據驅動觀察。
WPI的分析系統使用Vertica和R分析軟件,運用物種存在-消失數據(通過處理原始相機捕獲數據)和“協變量”(氣候,林緣和人類存在的數據)去估計某一區域的物種種類。
“說真的,在環境科學,我們沒有駕馭大數據的能力,”阿烏馬達說,“我們需要一個系統,可以無縫集成到有用的信息上。這就是我們與惠普的合作變得非常重要的原因所在。”
數據可以改變世界
“我們已經學到了很多東西[在過去的25年],”阿烏馬達補充道,“作為一個非營利性的環保組織,如果我們真的想嘗試改變世界,很多傳統的做法是與政府共事,并努力通過各種干預措施影響改變。但是如果你想以數據驅動的方式去做,你真的需要收集大量的數據。對我們來說與有此專長的機構合作伙伴非常重要,現在在非營利世界不同組織這種情況正在出現。“
到目前為止,CI的TEAM和惠普地球洞察分析出的數據不太令人樂觀。 275個TEAM監視器,其中的60個(22%)檢測到現存物種要么是顯著降低要么與基線水平相比有所降低。例如,西方大猩猩——在剛果共和國極度瀕危的物種,從2009年的基準線來看似乎已經下降了10%。