針對我國提出的大數(shù)據(jù)戰(zhàn)略,各行各業(yè)都躍躍欲試,就環(huán)境信息化來說,環(huán)保大數(shù)據(jù)的第一步需要怎么走?這是我國環(huán)保行業(yè)目前面臨最迫切的問題。
面臨同樣的問題,美國環(huán)保局(EPA)已經(jīng)開始探索大數(shù)據(jù)的第一步——數(shù)據(jù)整合。對于EPA來說,內(nèi)部業(yè)務(wù)應(yīng)用階段(即辦公自動化和管理信息系統(tǒng))早已經(jīng)實(shí)現(xiàn),EPA的信息化已經(jīng)走向更加復(fù)雜的與各聯(lián)邦政府間數(shù)據(jù)共享、業(yè)務(wù)協(xié)同的高級應(yīng)用階段,將各個業(yè)務(wù)系統(tǒng)的數(shù)據(jù)整合集成到一起,成為EPA和聯(lián)邦政府履職的必要組成部分。
那么,美國通過哪些信息化手段將數(shù)據(jù)整合起來呢?
第一招——建立設(shè)施登記系統(tǒng)
實(shí)現(xiàn)EPA內(nèi)部和聯(lián)邦政府的數(shù)據(jù)集成,是數(shù)據(jù)整合的基石
為解決不同系統(tǒng)、數(shù)據(jù)庫之間的標(biāo)準(zhǔn)化和數(shù)據(jù)語意沖突的問題,方便數(shù)據(jù)的整合、共享,EPA建立了環(huán)境資料注冊(Environment Data Registry, EDR)機(jī)制,提供信息系統(tǒng)和數(shù)據(jù)的標(biāo)準(zhǔn)信息(包括名稱、格式、來源、位置等)。EDR分為系統(tǒng)程序及數(shù)據(jù)庫注冊、數(shù)據(jù)集合注冊、數(shù)據(jù)(元素)注冊、環(huán)境詞匯注冊、開發(fā)組件注冊、化學(xué)物質(zhì)注冊及設(shè)施登記(注冊)等。
其中,設(shè)施登記系統(tǒng)(Facility Registry System,F(xiàn)RS)是對包括企業(yè)、污水處理廠、民用設(shè)施、甚至采礦作業(yè)等享有排污權(quán)的設(shè)施進(jìn)行登記,為每個排污設(shè)施創(chuàng)建唯一、綜合的設(shè)施識別信息,形成排污設(shè)施登記數(shù)據(jù)庫。通過為每個排污設(shè)施賦予唯一的“設(shè)施標(biāo)識碼”,使不同業(yè)務(wù)系統(tǒng)數(shù)據(jù)之間的關(guān)系得以明確,實(shí)現(xiàn)跨業(yè)務(wù)系統(tǒng)和跨庫檢索。通過設(shè)施標(biāo)識碼建立排污設(shè)施與EPA和各州業(yè)務(wù)信息系統(tǒng)的鏈接,實(shí)現(xiàn)了EPA內(nèi)部和聯(lián)邦政府范圍內(nèi)的數(shù)據(jù)集成和共享。
FRS由OEI(環(huán)境信息化辦公室)集中管理和維護(hù),通過把各業(yè)務(wù)系統(tǒng)的設(shè)施數(shù)據(jù)鏈接起來, EPA可以做很多事情,比如搜索某一行業(yè)的所有被監(jiān)管設(shè)施;設(shè)施的準(zhǔn)確位置,包括排污口經(jīng)緯度等;某設(shè)施所涉及的各種排污許可和環(huán)境監(jiān)管信息;某企業(yè)的所有排污設(shè)施例如某石油公司的所有分廠等。
自上世紀(jì)90年代FRS開始實(shí)施以來,已近登記了160萬個設(shè)施記錄,整合了28個州的污染設(shè)施主數(shù)據(jù);管理超過7800個聯(lián)邦管理的設(shè)施,5萬個部落領(lǐng)地設(shè)施和超過3000個國家環(huán)境行為跟蹤(NEPT)設(shè)施數(shù)據(jù),成為EPA數(shù)據(jù)整合的基石。
EPA還通過污染設(shè)施的信息公開,收集公眾對設(shè)施數(shù)據(jù)質(zhì)量的問題反饋,識別和糾正錯誤數(shù)據(jù)和重復(fù)記錄。3年內(nèi)收到1.3萬個數(shù)據(jù)錯誤的反饋,更正了1.2萬個錯誤,大幅提高了設(shè)施信息質(zhì)量的準(zhǔn)確性和有效性。
第二招——建立環(huán)境數(shù)據(jù)傳輸與交換系統(tǒng)
使得EPA各部門、各州環(huán)保部門、環(huán)保團(tuán)體、企業(yè)等快速地交換環(huán)境數(shù)據(jù)
在信息化建設(shè)之初,為滿足各項(xiàng)業(yè)務(wù)需求,EPA也分別建設(shè)了信息系統(tǒng)和數(shù)據(jù)庫,這些系統(tǒng)大多互不兼容,難于共享。
對于不同業(yè)務(wù)系統(tǒng)的數(shù)據(jù)傳輸和交換需求,EPA沒有分別建立傳輸網(wǎng)絡(luò)和系統(tǒng),而是依靠統(tǒng)一的中央數(shù)據(jù)交換系統(tǒng)(Central Data eXchange,CDX)實(shí)現(xiàn)。這一平臺提供單一數(shù)據(jù)申報(bào)及交換窗口,使EPA各部門、州政府環(huán)保部門、部落或環(huán)保團(tuán)體、企業(yè)能夠快速傳輸、交換環(huán)境數(shù)據(jù)。CDX目前已經(jīng)延伸到加拿大及墨西哥,實(shí)現(xiàn)了跨境數(shù)據(jù)交換, 是EPA數(shù)據(jù)采集、傳輸和交換重要的基礎(chǔ)設(shè)施。
目前已超過26萬個用戶在CDX上注冊,50個州和9個部落運(yùn)用CDX所提供的空氣、水等相關(guān)環(huán)境數(shù)據(jù),60個系統(tǒng)的數(shù)據(jù)在CDX上交換,每年的交易數(shù)量超過80萬筆,節(jié)省了大量的時間和經(jīng)費(fèi)。
第三招——建設(shè)環(huán)境數(shù)據(jù)倉庫
形成綜合性的環(huán)境信息,并有利于實(shí)現(xiàn)數(shù)據(jù)的實(shí)時智能分析
為整合、集成業(yè)務(wù)系統(tǒng)和數(shù)據(jù)以獲取綜合性的環(huán)境信息,EPA的OEI還通過從不同業(yè)務(wù)系統(tǒng)中抽取數(shù)據(jù),整合形成環(huán)境數(shù)據(jù)倉庫(EnviroFacts)。
目前,包括大氣環(huán)境質(zhì)量、有害固體廢棄物、超級基金場地、有毒物質(zhì)排放清單、飲用水等大部分業(yè)務(wù)數(shù)據(jù)已經(jīng)整合到EnviroFacts中,分為大氣、水、土壤、固廢、有毒物質(zhì)、設(shè)施、輻射、守法等專題。公眾只要登陸EPA網(wǎng)站,就可以方便地查詢到所需要的各類環(huán)境信息。
作者單位:環(huán)境保護(hù)部信息中心
★啟示錄:
1、建立有唯一標(biāo)識的排污設(shè)施
我國很多地方都開展了“一企一檔”數(shù)據(jù)庫建設(shè),而對有排污權(quán)的設(shè)施進(jìn)行唯一標(biāo)示,不僅可以直接對污染設(shè)施進(jìn)行更加精細(xì)的管理,還建立起了各污染源之間的聯(lián)系,從而建立起全國范圍的“一企一檔”數(shù)據(jù)庫。比如某個集團(tuán)在某地有分廠,排污設(shè)施系統(tǒng)可以直接實(shí)現(xiàn)數(shù)據(jù)勾連,這也是未來實(shí)現(xiàn)大數(shù)據(jù)的基石。
2、建立統(tǒng)一的數(shù)據(jù)傳輸、交換系統(tǒng)
我國目前也存在多系統(tǒng)并存的現(xiàn)象,各系統(tǒng)之間很難“對話”。EPA通過建立唯一通道,暢通了各數(shù)據(jù)系統(tǒng),只要“路”暢通了,就能實(shí)現(xiàn)無處不到。我國的信息化建設(shè)也可以借鑒此“鋪路”經(jīng)驗(yàn),統(tǒng)一依托環(huán)保專網(wǎng)這一“高速公路”開展數(shù)據(jù)傳輸。
3、建立數(shù)據(jù)倉庫
數(shù)據(jù)可交換,已經(jīng)實(shí)現(xiàn)了互通共享,但有些數(shù)據(jù)是關(guān)系國計(jì)民生的,環(huán)保部門需要根據(jù)這些數(shù)據(jù)做決策。這就需要建設(shè)數(shù)據(jù)倉庫,以滿足社會的需求和決策的需求。