天氣預報是大數據應用最早的領域之一, 古人們總結出的節氣和天氣諺語沿用了幾個世紀。
如何預測天氣
前650年左右巴比倫人使用云的樣子來預測天氣。中國人至少在前300年左右有進行天氣預報的紀錄。古時靠觀察總結出天氣現象和天氣諺語來指導人們的生活,只是泛泛,卻也足以。
17世紀開始科學家開始使用科學儀器(比如氣壓表)來測量天氣狀態,并使用這些數據來做天氣預報。但很長時間里人們只能使用當地的氣象數據來做天氣預報,因為當時人們無法快速地將數據傳遞到遠處。1837年電報被發明后人們才能夠使用大面積的氣象數據來做天氣預報。
今天的天氣預報主要是使用收集大量的數據(氣溫、濕度、風向和風速、氣壓等等),結合有關氣象資料、地形和季節特點、經驗等綜合因素來研究確定未來的天氣情況。由于大氣過程的混亂以及今天科學并沒有最終透徹地了解大氣過程,因此天氣預報總是有一定誤差的。
目前,我國一般降水的預報準確率在80%左右,暴雨24小時預報的準確率大概是19%至20%,在相同算法下,美國的暴雨預報準確率是22%。
但是如果數據夠多、建立的數學模型夠精確,是可以接近自然的真實情況的。
氣象數據量不斷翻番
上世紀90年代及之前,中國氣象資料大部分局限于地面及高空觀測。當時,2000多個地面站以小時為單位收集氣象信息;120多個高空站每天觀測最多不超過4次。從數據量上看不算太多,即便考慮到衛星和雷達資料,其總體日增量也局限在GB量級。
現在,地面觀測站大約有4萬個,每10分鐘觀測一次,未來還將加密至分鐘級;在空間密度上,至少增加20倍,頻度將增加60倍,地面及高空觀測信息總量增加了1200倍。
而這些只占整個氣象數據的30%,雷達、衛星以及數值預報數據占到了70%。目前,氣象部門需要永久保存的數據目前約有4PB~5PB,年增量約1PB。每年的氣象數據已接近PB量級(1000GB=1TB,1000TB=1PB)。
這也正是大數據規律的體現,觀測信息量越大,所蘊藏的真實信息越多,就更能做好預報。
氣象服務盤活數據
海量氣象數據怎么用?這是大數據時代亟待考慮的問題。就現有情況看,數據在氣象預報、氣候預測診斷方面運用得比較充分;而在氣象服務領域,大量實況觀測數據往往被擱置。
目前的實況數據氣象服務主要基于單要素單一站點的形式。這意味著,人們收到的氣象服務只是周邊氣象站點的天氣情況,并且總有延遲。
為此,科研人員正在引進國際先進的空間數據融合數值模式方法,即將周邊幾個站點的數據以及其他傳感器所獲得的數據融合進模式中,反演出整個區域的天氣情況。從試驗結果看,運算速度達到分鐘級,小區域可達到秒級。
“這些工作都是在大數據的基礎上才能夠進行,無論模式如何先進,沒有海量的數據進入,都不能達到很好的效果。”中國氣象局公共氣象服務中心高級工程師唐千紅說。
讓科研人員欣喜的是,在大數據時代,數據并非單純指人們在互聯網上發布的信息。全世界的工業設備、汽車、電表上有著無數的數碼傳感器,隨時測量和傳遞著有關位置、溫度、濕度乃至空氣中化學物質的變化。可以設想,這些信息都可以被氣象部門所用。
EarthRisk是一家利用大數據對未來天氣情況作出預報的技術公司,它采用的預測模型項源自加州大學斯克利普斯海洋研究所。
該模型不同于以往的數值預報模式,可基于 820 億次計算以及 60 年的氣象歷史數據來識別天氣模式,然后將這些模式與當前的氣候條件進行比較,再運用預測性分析進行天氣預測,其預測時間更長、預測準度更高,最長可提前 40 天生成冷熱天氣概率,而傳統主觀預測的模型一星期以上的準度就不行了。
大數據時代下的氣象服務是什么樣子?唐千紅認為,在看得見的未來,融入了地理信息、社會經濟數據的氣象服務,能夠讓人們知道任意時間地點可能會發生什么,例如這陣風是否會吹翻門口的廣告牌,前面一個高速路口是不是在下雨、會不會發生山洪。
天氣預報的未來
毫無疑問,雖然現在吐槽再多,氣象部門還是一直在努力完善工作的。建設更多的觀測站,運用更加先進的計算設備、培養數據人才建立更完善的天氣預報模型,同時也離不開經驗豐富的預報人員,天氣預報、乃至是災難預報都能更加準確。
以后天氣預報的趨勢,是朝精細化,精準化發展。同時在這個過程中消耗的大量人力物力可以通過數據的共享和同其他行業的交叉應用來彌補,這方面,大數據的預測意義才越發顯得重要。