冬天到來后,雷鋒網編輯部的駐地之一北京和許多中國北方城市都陸續遭受霧霾侵擾,霧霾紅色預警屢見報端。一部分城市因為霧霾過重,飛機都無法起降了。媒體報道稱,為了驅除霧霾,北京周邊 1200 家工廠都采取了減產甚至停產的措施。
今年,政府和相關部門將配備來自IBM 和微軟的預測工具,這兩款工具去年已經經受過嚴格的測試。其中,北京市政府裝備的 IBM 預測工具能將傳統的數據源,如分布于北京的 35 個官方空氣污染監測站數據和來自環境監測站、公交系統、氣象衛星、地形圖、經濟數據甚至社交媒體的數據進行合并分析。而微軟的預測系統則負責整合分布于全國的 3000 個監測站的數據。這兩款工具都能將傳統的大氣化學物理模型與數據統計工具(如機器學習)相結合,以便用更短的時間做出更準確的預測。
“我們的優勢其實就是對各方數據的結合,”環境工程師黃巾(音)說道,他是 IBM 北京研究所的綠色地平線項目主管,這個項目的詳細內容可見雷鋒網(公眾號:雷鋒網)此前的報道《IBM機器學習幫助政府勢力抗霾》。眼下,IBM 在未來三天霧霾預測準確度上已經超過 80% ,在 7-10 天的預測上精確度也在 75% 左右。
微軟現在則負責為中國環保部提供 48 小時的霧霾預測,2015 年時,它在預測北京未來 6 小時內霧霾情況的準確度上已經達到 75% ,而未來 12 小時則可達 60% 。
歐洲哥白尼大氣監測服務處主管 Vincent-Henri Peuch 表示,事實上,將物理模型與機器學習相結合來完成空氣質量預測是一個非常活躍的研究領域。作為大氣科學家,他認為將紛繁復雜的數據相結合是個正確的選擇:每種數據都含有重要信息,而且它們并不會相互妨礙。
這種方法也得到了市場的認同,眼下,IBM 的預測工具已經部署在了印度新德里和南非約翰內斯堡,北京一家名為 AirVisual 的新創公司也在為私人用戶提供融合了機器學習技術的預測服務。
借助這些預測工具,北京市政府聲稱已經取得了顯著的成效。據政府引用的數據顯示,2015 年的細顆粒物污染水平比 2014 年降低了 6% 。
治理霧霾與經濟發展不是仇敵,兩者必須共生共存,不能偏廢。IBM 的預測工具就考慮到了這一點,該系統內置一個模擬器,它可以模擬城市上風口工廠停產和限號出行對城市環境帶來的影響。黃巾表示:“IBM 的工具可以估算各種措施下污染排放對經濟發展影響的程度。”
AirVisual、IBM 和微軟的工具可在不同地區工作,不過它們需要接入當地的物理模型,并輸入本地化的數據和可變參數。就拿約翰內斯堡來說,該城市只有 8 個空氣污染監測站,“因此,預測工具需要用到南非其他監測站的數據,”計算機工程師 Tapiwa M. Chiwewe 說道。
英屬哥倫比亞大學的團隊研究發現,根據不同的情況,預測工具需要配合本地化的機器學習算法。該團隊認為,不同類型的機器學習花費的計算成本在于預先輸入的數據與運行中輸入數據之比。對于北京來說,歷史空氣質量數據的缺乏導致政府必須選擇出更合適的系統,只參考其他城市可能無法取得相同的效果。畢竟在數據完全不同的情況下,霧霾預測的效果根本沒有可比性。
要想達到世界衛生組織(WHO)制定的空氣質量標準,全世界有許多城市還有很長的路要走。2015 年的數據顯示,可吸入顆粒物(PM)每年造成的 DALY(傷殘調整生命年,指生命年的喪失或有能力的生命年減少)損失達到 1.03 億。刊登在《柳葉刀》上的 2015 年全球疾病負擔研究報告顯示,可吸入顆粒物已經成了全世界第六大疾病誘發因素。因此,未來五年內,空氣質量監測市場的規模將每年增長 8.5% ,達到 56.4 億美元。而與其息息相關的空氣質量預測市場也會迎來發展的黃金時期。