在一般人的印象中,油田與科研之間似乎劃不上等號,再把油田與1000名科研人員聯系在一起,很多人會問:這些科研人員在油田中的作用是什么?作為一名對油田不太了解的IT記者,我也有這樣的疑問。為此,ZDNet記者近日專門采訪了天津大港油田信息中心數據管理部主任范德軍。
1000這個數字,是天津大港油田科研人員的規模。在范德軍看來,與公司3、4萬名職工數相比,科研人員比例并不高,但是他們的作用卻非常大。大港油田信息中心負責整個油田信息化建設,而為科研生產提供好的信息化支持,是超脫管理之上的重要業務職能,因為勘探開發永遠是油田的核心任務。在當今大數據、云計算時代,這些新技術同樣可以變為油田科研人員手中的“找油利器”,讓他們成為出色的數據科學家。因為數據對于油田的重要性之高,超乎我們的想象;而數據科學家能夠給油田勘探、生產帶來的價值,可能會在很短時間內呈現幾何級數增長。為了讓這一切成為現實,天津大港油田采用IBM Platform Computing,為石油行業走出一條構建在云管理平臺之上的大數據應用之路進行探索。
天津大港油田信息中心數據管理部主任范德軍
傳統石油勘探數據的獲取耗時耗力
對于石油行業來說,石油勘探開發中的科研工作是一項多學科協作的智慧集結。石油勘探開發流程包含很多步驟:第一步是地震處理,也就是收集地震波信息;第二步是地震解釋,用于了解地層底部結構;第三步是測井評價和地質建模,也就是根據地震波了解到的地層情況構建模型;第四步是制定數據模擬開發方案。在石油勘探開發整個過程中,有了采集到的數據,只有通過石油行業專業軟件,再綜合人的經驗和對地層的認識,才能最終找到原油并決定在哪里打井。
天津大港油田信息中心有兩個主要機房,第一機房服務于勘探科研生產,第二機房部署管理類系統。機房位于這個大樓中。
在這一整套流程中,數據的采集、獲取、建模的最終目的,是讓科研人員正確找到井位,并且還能估計出井的產能。但是范德軍告訴記者,有時候一個油藏描述項目卻要用三到四個月的時間來準備數據。“以我港東油田某區塊為例,我們初步計劃先打五口井,相應就需要研究這個油田是否滿足打井條件。這時候收集地震處理、地震檢測、測井數據以及井名、井深和井坐標就得花費三到四個月的時間;而如果再要把這些數據整理并錄入到軟件里,還需要一個科室人員的投入,而單單整理數據就占用了科研生產三分之一左右的時間。”
傳統的數據收集整理方法不僅僅耗時耗力,而且石油行業軟件都是大型專業軟件,架構龐大、技術復雜,一般部署在Unix或者Linux操作系統上,底層采用Oracle數據庫。對于科研人員來說,學會使用這些軟件難度就非常大,日常維護管理更是難于上青天,畢竟他們不是IT人員,更不懂IT技術,而且單機運行會出現數據無法共享和數據丟失現象,迫切需要考慮一套行之有效的方法。
IBM Platform Computing提高30%科研生產效率
為此,天津大港油田從兩年前開始嘗試采用IBM Platform Computing搭建一個支撐油田勘探開發科研工作的云管理平臺。這個平臺是一個面向科研人員的平臺,也就是真正把這些科研人員變成數據科學家,讓他們通過這個平臺尋找和定位井位。
Platform一如它的名字——平臺,核心任務是負責對資源進行整合、調度,確保上層應用能夠訪問底層資源。作為一個平臺,Platform Computing實際上跨越了好幾個環節,包括數據的整理、數據的存儲以及在這之上的大數據運算。在這之中,Platform Computing要充當管理職能,為這些系統提供快速響應以及合理、高效的應用。
就Platform Computing在天津大港油田的運用來看,據范德軍介紹,今年天津大港油田計劃通過Platform Computing收集、分析數據,從而支持開采100口井,從而支持油田每年500萬噸油氣當量的產能。為了支持龐大的數據管理、存儲和分析,其實Platform Computing構建了一個云管理平臺,云的特點包括靈活、可擴展和高效,這些特點被Platform Computing發揮到最大。
信息中心擁有既懂信息技術又懂專業技術的專門人才,依托Platform Computing的云管理平臺,把石油勘探開發的研究人員從計算、硬件、存儲、軟件等繁瑣并且不擅長的IT問題中解放出來,專攻科技??蒲腥藛T只要明確提出需要在哪個區塊進行研究工作,信息中心就可以馬上為該科研人員提供工具,做到協同研究環境中的統一管理。這樣一組數據可能更有說服力,據范德軍介紹, Platform Computing投入生產運行之后,科研生產效率提高30%左右;鑒于油田勘探開發生產涉及的專業特別多,實際上個別專業科研生產效率提升了10倍。
而具體到數據分析業務,哈里伯頓(Halliburton Company)、斯倫貝謝(Schlumberger)等行業軟件基本上占領了石油行業軟件市場,這些軟件雖然本身帶有數據分析功能,但是應用復雜并且信息無法共享,而Platform Computing提供了一個硬件資源、軟件資源和數據資源集結的高性能計算平臺,也讓石油行業的數據分析業務取得質的飛躍。
成石油行業第一個協同研究云“嘗鮮者”
天津大港油田信息中心目前擁有500人,具體從事信息化工作的人員數量在220人左右。信息中心有兩個主要機房,第一機房服務于勘探科研生產,第二機房部署管理類系統。服務器節點達到近500臺,總存儲空間3個PB,機房面積在2000平米左右。單從人員數量和機房規模來看,天津大港油田信息中心并沒有“豪華”配置,但是在石油行業,它卻是第一家將協同研究云用于勘探科研生產的單位。
天津大港油田信息中心機房服務器節點達到近500臺,總存儲空間3個PB,機房面積在2000平米左右。
從2008年開始,天津大港油田著手從虛擬化開始建立云平臺,目前搭載了三個云:一個是以虛擬化為基礎的基礎設施云,目前可以提供200多套業務應用系統;第二個是桌面云,應用于機關部門人事、財務和黨群員工的電腦桌面;第三個云,稱為協同研究云,其重點在于支撐勘探科研生產工作。
協同研究云的最主要目的就是勘探科研生產工作,通過云管理平臺的搭建,更好地把硬件資源集中起來。而勘探開發研究的專業軟件調用的數據量特別大,建立模型非常復雜,運行速度會比較慢。云管理平臺的工作原理在于,對硬件資源進行集中管理,根據不同業務需要來高效合理地分配資源,整個后臺是一個統一集群,其上的硬件資源是浮動的,通過靈活的資源調度來支持擴展的應用。
提及對Platform Computing的選擇,在范德軍的介紹中記者得知,也經歷了一個考驗期。天津大港油田對開源產品一直報以非常開明的態度,在高性能計算方面,先后對Cluster Resources的Moab、Sun Grid進行了詳細測試,而最終決定采用Platform Computing 的原因,還是基于Platform Computing作為成熟商業產品的優勢:開源系統二次開放成本會比較高,而且需要一個持續較長時間的開發周期,而天津大港油田偏向于選擇能夠即刻投入到實際工作中去的產品,而且不需要投入精力進行漫長的開發。
在IBM收購Platform之后,其實已經改變了Platform Computing單純作為一個軟件產品的產業形態,IBM把Platform Computing并入硬件部門,這也就意味著Platform Computing在軟硬件優化方面有著極大的優勢,也被賦予重大的責任。Platform Computing并不是一個單一軟件,稱其為家族產品可能更合適,共包括上中下三層,三層實現協同。下層是基礎設施層,由云管理平臺來統一管理物理機和虛擬機共存的云環境,這是Platform的優勢;中間層是應用調用層,IBM在這里做中間件的管理,負責整個作業的派發、調度、資源管理;再上一層就是最上層的應用層,各式各樣的應用軟件與中間層形成一個集成,使用底層由云平臺提供的計算資源。
在記者看來,Platform Computing有三大優勢:首先,完整性,整個大數據平臺從設計開始是一套完整的系統,是集成化的;其次,性能。IBM的大數據平臺在實時響應、快速處理等方面有嚴苛的要求;最后,是容易被大家所忽略的,那就是整個系統的開放性和兼容性。Platform Computing的設計理念就是一個跨平臺的、面向不同應用的產品,眾多應用場景、分析軟件都跑在Platform Computing平臺上,系統的開放性、兼容性非常好。
結束語
其實在很多時候,IT廠商所提供的產品或者解決方案必須要兼顧客戶的成長,一成不變也就意味著保守和缺乏創新。在采訪最后范德軍表示,雖然選擇Platform Computing的原因在于其比開源產品更加成熟以及穩定,但是這并不意味著開源就不好。天津大港油田IT專業人員的技術水平越來越高,而石油行業需要的支撐本行業的專業軟件也非常多。Platform Computing在開放接口方面能否更加open甚至做到開源,給予石油行業用戶更多基于Platform Computing進行二次開發的機會?這或許是成長中的客戶,給予Platform Computing在未來的挑戰。