數(shù)據(jù)的真實(shí)價(jià)值就像漂浮在海洋中冰山,第一眼只能看到冰山一角,而絕大部分則隱藏在表面之下。在大數(shù)據(jù)時(shí)代,數(shù)據(jù)的價(jià)值仍然存在,只是處于“休眠”狀態(tài),而要解鎖這些數(shù)據(jù)的價(jià)值,就必須通過(guò)統(tǒng)計(jì)人員的不懈努力并借助新一代的方法和工具,來(lái)釋放數(shù)據(jù)隱藏的價(jià)值。
大數(shù)據(jù)來(lái)襲勢(shì)不可擋
世界每時(shí)每刻都在產(chǎn)生數(shù)據(jù),數(shù)據(jù)又開(kāi)始以幾何級(jí)增長(zhǎng),這種增長(zhǎng)速度已經(jīng)不是“爆炸”二字可以形容的了。國(guó)際數(shù)據(jù)公司(IDC)的《數(shù)據(jù)宇宙》報(bào)告顯示:2008年全球數(shù)據(jù)量為0.5ZB,2010年為1.2ZB,人類(lèi)正式進(jìn)入ZB時(shí)代。更為驚人的是,2020年以前全球數(shù)據(jù)量仍將保持每年40%以上的高速增長(zhǎng),大約每?jī)赡昃头槐?,預(yù)計(jì)2020年將突破35ZB。
任何事物量變到一定程度必然要發(fā)生質(zhì)變。哈佛大學(xué)里·金教授說(shuō):“大數(shù)據(jù)是一場(chǎng)革命,龐大的數(shù)據(jù)資源使得各個(gè)領(lǐng)域開(kāi)始了量化進(jìn)程,無(wú)論學(xué)術(shù)界、商業(yè)還是政府,所有領(lǐng)域都將開(kāi)始這種進(jìn)程。”今天,我們進(jìn)入了信息社會(huì),面臨著大數(shù)據(jù)時(shí)代的來(lái)臨,云計(jì)算、物聯(lián)網(wǎng)、移動(dòng)終端及可穿戴設(shè)備高度發(fā)達(dá)與融合,不管你是誰(shuí)、不管你愿意不愿意,都要與數(shù)據(jù)打交道,要么在生產(chǎn)數(shù)據(jù),要么在接收數(shù)據(jù)。大數(shù)據(jù)能輕而易舉地解決常規(guī)統(tǒng)計(jì)調(diào)查無(wú)法涉及到的、各種復(fù)雜多變的行業(yè)和領(lǐng)域的統(tǒng)計(jì),因?yàn)榇髷?shù)據(jù)不但量大,其涵蓋面也十分廣泛,任何時(shí)候、地方、人或單位,只要發(fā)生了互動(dòng)行為就要留下“痕跡”,而如何在各種各樣的數(shù)據(jù)中進(jìn)行深入的分析和挖掘,發(fā)現(xiàn)這些數(shù)據(jù)當(dāng)中隱藏的更深刻的規(guī)律和現(xiàn)象,對(duì)這些信息進(jìn)行加工整理獲得的大數(shù)據(jù),必然能夠有效解決現(xiàn)行統(tǒng)計(jì)和國(guó)民經(jīng)濟(jì)核算資料不全的問(wèn)題,更好地服務(wù)于政府決策和社會(huì)各方面的需求。
有效利用大數(shù)據(jù)資源
實(shí)現(xiàn)數(shù)據(jù)共享。除統(tǒng)計(jì)部門(mén)外的其他政府部門(mén)也積累了海量的數(shù)據(jù)和行政記錄,由于數(shù)據(jù)開(kāi)放程度不足,大量的政府?dāng)?shù)據(jù)處于“休眠”狀態(tài),而且政府和公共部門(mén)是最大的信息數(shù)據(jù)生產(chǎn)、收集、使用和發(fā)布的單位。但現(xiàn)實(shí)情況是,海量的數(shù)據(jù)分散在各個(gè)部門(mén)、各個(gè)層級(jí),彼此分割,形成一個(gè)個(gè)“信息孤島”。城市中不同單位之間的數(shù)據(jù)流通往往是以紙質(zhì)文件形式進(jìn)行的,數(shù)據(jù)的存儲(chǔ)也是以電子文檔的形式和紙質(zhì)文檔的形式進(jìn)行,而且不同城市之間的數(shù)據(jù)交流并不是很方便,一般是孤立的,之間沒(méi)有共享的網(wǎng)絡(luò)平臺(tái),是一座座“數(shù)據(jù)孤島”。這就給大數(shù)據(jù)的實(shí)現(xiàn)帶來(lái)很大阻礙,尤其針對(duì)基層統(tǒng)計(jì)分析人員來(lái)說(shuō),給數(shù)據(jù)的全面搜集帶來(lái)很大阻力,不得不停留在小數(shù)據(jù)分析時(shí)代。因此,要實(shí)現(xiàn)大數(shù)據(jù)在統(tǒng)計(jì)上的應(yīng)用,必須打破信息之間“壁壘”,真正實(shí)現(xiàn)信息資源共享。只有這樣,才能夠最大限度地滿(mǎn)足常規(guī)統(tǒng)計(jì)、尤其是國(guó)民經(jīng)濟(jì)核算的數(shù)據(jù)需求。
制定統(tǒng)一的標(biāo)準(zhǔn)。首先統(tǒng)計(jì)是一門(mén)科學(xué),是一項(xiàng)十分嚴(yán)謹(jǐn)?shù)墓ぷ鳌R虼?,統(tǒng)計(jì)指標(biāo)的含義、口徑、范圍、來(lái)源渠道、計(jì)算方法、計(jì)量單位等應(yīng)該統(tǒng)一,只有這樣才具有可比性。比如,在大數(shù)據(jù)背景下,如果能有效獲取大型超市、商場(chǎng)、電商歷史銷(xiāo)售明細(xì),將為CPI調(diào)查的小類(lèi)、基本分類(lèi)權(quán)重分配提供更具說(shuō)服力的參考依據(jù)。但是很多食品以千克為單位,而企業(yè)的銷(xiāo)售單位往往是袋、瓶或件。如果折算為千克,需要大量細(xì)致而繁瑣的工作,并且還需要根據(jù)企業(yè)變化而變化,進(jìn)行動(dòng)態(tài)調(diào)整。數(shù)據(jù)標(biāo)準(zhǔn)不統(tǒng)一,指標(biāo)口徑雜亂,數(shù)據(jù)之間就難以整合和銜接,界定哪些信息屬于可在統(tǒng)計(jì)上應(yīng)用的大數(shù)據(jù),應(yīng)將大數(shù)據(jù)的口徑、范圍調(diào)整為常規(guī)統(tǒng)計(jì)所需的口徑和范圍,對(duì)大數(shù)據(jù)的海量信息進(jìn)行甄別、篩選,然后挖掘出統(tǒng)計(jì)核算所需要的、且常規(guī)統(tǒng)計(jì)所難以取得的資料。其次大數(shù)據(jù)和小數(shù)據(jù)在運(yùn)用過(guò)程中的結(jié)合所需要的理論解釋和技術(shù)手段也都需要?jiǎng)?chuàng)新,這就需要依據(jù)模糊數(shù)學(xué)、統(tǒng)計(jì)學(xué)、計(jì)量經(jīng)濟(jì)學(xué)等學(xué)科的理論基礎(chǔ),構(gòu)建和完善智能決策系統(tǒng)的理論基礎(chǔ)和理論體系。在這樣的理論基礎(chǔ)上,還要突破技術(shù)上的障礙,實(shí)現(xiàn)政府?dāng)?shù)據(jù)交流的網(wǎng)絡(luò)平臺(tái)架構(gòu)、網(wǎng)絡(luò)數(shù)據(jù)的安全和保密、數(shù)據(jù)分析和應(yīng)用體系的軟件設(shè)計(jì)和完善。同時(shí),傳統(tǒng)的個(gè)人信息保護(hù)制度,在大數(shù)據(jù)場(chǎng)景下變得越來(lái)越難以操作,為防止泄密,有必要制定一個(gè)關(guān)于大數(shù)據(jù)開(kāi)發(fā)利用的制度,保障個(gè)體信息資料的安全。
培養(yǎng)大數(shù)據(jù)人才。與信息技術(shù)其他細(xì)分領(lǐng)域人才相比,大數(shù)據(jù)產(chǎn)業(yè)對(duì)人才的復(fù)合型能力要求更高,尤其是需要具備綜合掌控?cái)?shù)學(xué)、統(tǒng)計(jì)學(xué)等方面知識(shí)的復(fù)合型人才,同時(shí)更離不開(kāi)大數(shù)據(jù)發(fā)掘、加工、整理和分析的人才。因此,必須培養(yǎng)和造就一支懂技術(shù)、懂管理、懂指揮的統(tǒng)計(jì)大數(shù)據(jù)建設(shè)專(zhuān)業(yè)團(tuán)隊(duì),為統(tǒng)計(jì)大數(shù)據(jù)管理人才提供保障。大力培養(yǎng)一批大數(shù)據(jù)應(yīng)用、尤其是大數(shù)據(jù)分析方面的人才,為大數(shù)據(jù)廣泛應(yīng)用于政府統(tǒng)計(jì)奠定基礎(chǔ)。中國(guó)大數(shù)據(jù)應(yīng)用起步相對(duì)較晚,教育和職業(yè)培訓(xùn)尚不能很好地滿(mǎn)足行業(yè)發(fā)展需求,預(yù)計(jì)目前大數(shù)據(jù)人才缺口已經(jīng)超過(guò)100萬(wàn)人。而且隨著大數(shù)據(jù)在中國(guó)的不斷發(fā)展,各個(gè)地方都開(kāi)始興建大數(shù)據(jù)中心,但對(duì)于大數(shù)據(jù)中心的建設(shè),更多地還停留在“建機(jī)房、上設(shè)備、堆數(shù)據(jù)”的階段,忽視了大數(shù)據(jù)對(duì)數(shù)據(jù)的分析和應(yīng)用。比如,社會(huì)信用、食品藥品安全等一些社會(huì)管理和公共服務(wù)系統(tǒng)更多形成的是結(jié)果和狀態(tài)數(shù)據(jù),大量的過(guò)程和行為數(shù)據(jù)并未有效采集,占數(shù)據(jù)總量95%以上的非結(jié)構(gòu)化數(shù)據(jù)被束之高閣。這些數(shù)據(jù)如能夠得到合理保存并加以開(kāi)發(fā)利用,將有極大的價(jià)值。
(作者單位:國(guó)家統(tǒng)計(jì)局七臺(tái)河調(diào)查隊(duì))