對很多在北京生活的人來說,一場不期而至的重度霧霾或許攪亂了他們在黃金周拾起的好心情。但在中國地質調查局的大會議室里,一場屬于數學地球科學家們的聚會正悄然上演,臺上的激情演講、臺下的踴躍提問,似乎是在用智慧的“火花”和窗外令人壓抑的天氣“唱反調”。
用數字破地質之“霾”
用巧妙的公式撥開地下世界的迷霧、用縝密的邏輯驅散找礦大軍的陰霾。10月9日,2014年國際數學地球科學前沿問題學術研討會在京召開。
“基于大數據理念,充分利用現代數學地質理論與方法,云計算、物聯網、移動通信等新一代信息技術,加強兩者交叉融合,為加快實現地質找礦突破等方面提供了前所未有的機遇。”正如中國地質調查局副局長王研在致辭中指出的,數字技術的大發展給地調工作帶來了新的啟迪。
“大數據技術的意義不在于掌握規模龐大的數據信息,而在于對這些數據進行智能處理,從中分析和挖掘出有價值的結構化信息。”數據、信息、知識、財富、服務、再數據,從數據到財富是一個過程復雜的完整數據鏈。
如何實現由“數字地質”向“智慧地質”的轉變?
“過去我們只用統計分析研究數據”,中國地質調查局發展研究中心李超嶺研究員說,2010年以來,隨著大量智能技術和設備的出現,中國地質調查局使數字地調系統向智能化延伸的腳步就沒有停歇過。
逐步實現從數字化轉向智能、從2D走向3D的地質調查,形成天地一體野外地質調查工作、管理和安全保障和泛在服務模式,這便是智能地質調查體系架構。
“目前,數字地質調查系統已在國內全面推廣應用,并開始被國外引進和應用,推廣應用超過15000套,其中涉及國內八大工業部門及特大型礦業公司,累計單位超過1000家。”
“這是集文字、素描、照片、視頻、音頻、電子羅盤、信手剖面為一體的野外智能電子手簿。”結合中國地質調查信息網格平臺、云計算、網格GIS和北斗系統,中國地調局還開發出野外地質調查安全保障服務主動服務技術。該平臺能夠根據用戶的位置,自動或通過請求方式,挖掘獲取用戶所處位置的預警信息、附近人員信息、地質信息等,再用北斗短信或網絡的方式發送給查詢用戶。
數字地質學是以數字技術為基礎的一門交叉學科,獲取信息的渠道、信息集中速度及規模成了決定一個系統成敗的關鍵。
網連千線,有容乃大
在館長嚴光生的帶領下,與會嘉賓參觀了全國地質資料館,體驗了檢索功能。在微機室,工作人員正將影印的地質資料信息輸入電腦,編輯成數字資料后入庫。
“咦,溫家寶?!”當一份由溫家寶曾于1979年在甘肅省地質局工作時所做的地質調查報告出現在投影儀上時,現場頓時熱鬧了起來。
“我們要打造地質學界的Google!”嚴光生的這句話并非口號,現如今全國地質資料館的老資料數字化率已超過90%;電子數據量達56TB,近幾年來,更是以5TB/年至8TB/年的數據量增長。“數字地質資料匯聚已具規模,為地質資料的社會化服務奠定了基礎。”
他說,下一步將利用國際標準接口建立數字資源的國際互聯,將地質目錄與元數據、調查報告、科學報告、成果圖件、成果數據及出版物以目錄服務、地圖服務、文檔瀏覽、數據下載等在線數字資源服務聚合。
“地質學從它最早期建立的時候開始,實質上就是一門信息學科。”數據資源為地質學發展的終極目標——全面掌握和了解地球運動規律,建立滿足實際需求的地質模型提供了一個看起來非常合適的解決方案。
早在8年前,《直面明日挑戰——美國地調局十年科學戰略(2007-2017)》報告中就有這樣一段話:“注重為科學家、資源管理者和公眾發送和解釋高分辨率的綜合性圖件和其他形式的數據和信息,發揮為整個美國地質調查局服務于世界的廣博知識庫作基礎性貢獻的功能。”
大數據技術為智能與云服務支撐應用研究現狀。基于大數據平臺技術hadoop平臺原型系統的智能地質調查,無需人工參與,可自動聚類,智能推薦相關文檔,2天~3天就能完成一個省幾十年資料文檔的存儲。
中國首臺千萬億次超級計算機“天河1號”,擁有186368個核,總計算性能達168萬億次/每秒,計算峰值達4700萬億次/每秒。對華北地區的3D成像大約需要1天,若用清華的計算機大約需17天。
問題導向概念的植入讓美國地調局的轉型一舉成功。那么,對研究數字地質的個人來說,是做迷失于數字海洋的小舟,還是做數字世界的建筑師?這是個問題。
“老”小伙與老“小伙”
在普通人的印象里,科研人員乃是不茍言笑埋頭實驗室,偶爾透過厚重鏡片,用望穿了幾個世紀的深邃眼神俯視眾生,一副“我們的世界你們不懂”的形象。這其中,以數學家最甚。但參加過該會后,記者對科學家這個群體的原有認識卻完全被打破了。
這里有一群世界上最聰明可愛的人。
老“小伙”趙鵬大。
上場前,主持人就他名字的英文直譯“big bird”來了個即興小段子,引來滿場笑聲。就在記者還震驚于如此調侃一位頗有威望的80多歲老教授是否不太禮貌時,著紅黑條紋襯衫、一頭銀發的趙鵬大院士登上了講臺,這時記者才“有點明白了”。會后記者了解到,這位中科院院士就是在2011年用微博寄語新生的“國內最潮老校長”。
趙鵬大說,大數據時代正呼喚每個學科建立自己的數據庫,但“地質數據不是越多越好”。他認為,與商業領域的“自然獲取”、“無成本獲取”數據不同,地質數據的“成本”很高,因此獲取數據必須本著“充分、必要、合理”的原則,貴在“代表性”和“準確性”,而不是盲目追求數量。
“老”小伙Jef Caers。
自信的表情、飽滿的狀態、抑揚頓挫的語調,記者感到正在臺上發言的不是斯坦福大學能源工程系的數學家,而是當年參加總統競選的奧巴馬。
置身于一群白發長者中的Jef高挑英俊,很容易被誤認為是某個教授的助手。
“你負責組織一個長城周邊無圖地區的冒險徒步旅行,需要決定如何帶水和食物以及提貨位置,怎樣預測旅行所需時間和搜集數據所需精力?”當這個年輕的比利時人用一個中國人熟悉的建筑和休閑娛樂活動來解釋對外行來說復雜難懂的方程式時,冰冷的數字仿佛變得親切起來。
Jef說,他在工作中發現,在現實預測中傳統地質統計學存在不足和局限:一是對樣本要求苛刻,導致取樣耗時長;二是樣本差異性無法真實體現于圖像,導致生成圖像與實際情況相差甚遠。于是他想到將多點地質統計學應用于圖像的隨機建模,使用訓練圖像直接采樣,快速生成復雜空間變異性,最后使用圖像縫合算法實現預測,“它的好處是可以從任何地方捕獲信息”。
對數學的熱愛、絕不墨守成規、以問題為導向、發散性思維、從生活中找規律,讓兩人找到了統計學原理與地質找礦的結合點,也讓兩人分別于1990年和2014年獲得國際數學地球科學協會最高獎——克倫賓獎。