當(dāng)前社會(huì),數(shù)據(jù)處于一種爆炸增長(zhǎng)狀態(tài),在經(jīng)濟(jì)社會(huì)各領(lǐng)域,對(duì)于數(shù)據(jù)的駕馭決定了未來(lái)的發(fā)展和走向,調(diào)查研究工作也不例外。筆者認(rèn)為,在大數(shù)據(jù)時(shí)代勢(shì)不可擋的背景下,調(diào)查研究應(yīng)當(dāng)順勢(shì)而為,努力做到四個(gè)轉(zhuǎn)變。
從人工調(diào)研為主向基于互聯(lián)網(wǎng)數(shù)據(jù)調(diào)研的轉(zhuǎn)變
傳統(tǒng)的調(diào)查研究方法包括會(huì)議調(diào)查法、實(shí)地觀察法、文獻(xiàn)調(diào)查法、書面調(diào)查法、測(cè)驗(yàn)調(diào)查法、資料調(diào)查法、綜合歸納法、問(wèn)卷調(diào)查法等,我們統(tǒng)稱之為人工調(diào)研。人工調(diào)研的突出優(yōu)勢(shì)在于調(diào)查人員能夠直觀地掌握第一手的資料和情況,但其缺點(diǎn)同樣是顯而易見的:調(diào)研樣本采集困難、調(diào)研費(fèi)用昂貴、調(diào)研周期過(guò)長(zhǎng)、調(diào)研環(huán)節(jié)監(jiān)控滯后等等。
與傳統(tǒng)的手工或面對(duì)面調(diào)研方式不同,互聯(lián)網(wǎng)數(shù)據(jù)調(diào)研是利用互聯(lián)網(wǎng)和科技手段在線收集數(shù)據(jù)信息的一種新型調(diào)研方式。比較常見的方式有在線調(diào)查、計(jì)算機(jī)輔助電話咨詢、Email問(wèn)卷調(diào)查等。較之人工調(diào)研,互聯(lián)網(wǎng)數(shù)據(jù)調(diào)研具有信息收集的廣泛性、調(diào)研信息的及時(shí)性和共享性、調(diào)研的便捷性和經(jīng)濟(jì)性、調(diào)研結(jié)果的準(zhǔn)確性等顯著優(yōu)勢(shì)。以在線調(diào)查為例,通過(guò)ip、cookie等技術(shù)手段,對(duì)受訪者的注冊(cè)過(guò)程和答題過(guò)程進(jìn)行甄別,可以有效提高問(wèn)卷答案的真實(shí)性。由于在線調(diào)查不受時(shí)間和地點(diǎn)的限制,并且可以省掉傳統(tǒng)調(diào)查中很多必不可少的環(huán)節(jié),大大縮短了調(diào)研周期,提升了調(diào)研工作的效率。
從樣本采集分析向云數(shù)據(jù)、全覆蓋數(shù)據(jù)調(diào)研的轉(zhuǎn)變
隨著大數(shù)據(jù)時(shí)代的到來(lái),在互聯(lián)網(wǎng)和信息技術(shù)革命強(qiáng)大推動(dòng)力的驅(qū)使下,調(diào)查研究工作的數(shù)據(jù)基礎(chǔ)開始面臨新的挑戰(zhàn)。以前,傳統(tǒng)的調(diào)研工作往往采用樣本采集分析的方式,這種方式雖然可以利用少量的信息調(diào)查對(duì)象的整體情況,但仍然比較粗糙,分析的信度不夠高。云數(shù)據(jù)和全覆蓋數(shù)據(jù)具有體積巨大、類型繁多、速率極高、效度較準(zhǔn)但是價(jià)值密度低的特點(diǎn),面對(duì)這一特點(diǎn),調(diào)查研究工作的數(shù)據(jù)基礎(chǔ)將發(fā)生較大轉(zhuǎn)變,我們分析與調(diào)查的是調(diào)研對(duì)象相關(guān)的所有數(shù)據(jù),而不是依靠分析少量數(shù)據(jù),我們不再僅僅追求準(zhǔn)確性,而應(yīng)樂(lè)于接受數(shù)據(jù)的紛繁復(fù)雜。
大數(shù)據(jù)時(shí)代的調(diào)查研究工作,一方面要盡可能掌握和運(yùn)用更多的數(shù)據(jù),以便我們更加正確地考察細(xì)節(jié)并進(jìn)行新的分析。當(dāng)然,實(shí)現(xiàn)各行業(yè)、各單位尤其是政府各部門之間的信息共享,是獲取云數(shù)據(jù)、全覆蓋數(shù)據(jù)的基本前提。在此基礎(chǔ)上,應(yīng)進(jìn)一步通過(guò)各種媒介平臺(tái),搜集、梳理、分析海量信息,獲取網(wǎng)絡(luò)輿情、民意取向等,通過(guò)梳理信息流并借助先進(jìn)的技術(shù)工具進(jìn)行整理,形成覆蓋調(diào)查研究問(wèn)題涉及的全方位因素的云數(shù)據(jù),為提高調(diào)查研究水平夯實(shí)數(shù)據(jù)基礎(chǔ)。另一方面,也要看到海量數(shù)據(jù)存在著“偏愛潮流”、“不懂背景”、“過(guò)分解構(gòu)”等局限性,應(yīng)結(jié)合一定的分析方法和手段,例如調(diào)查問(wèn)卷、深入訪談、焦點(diǎn)座談、二手資料研究、標(biāo)桿研究等,將獲取的海量云數(shù)據(jù)和可信的傳統(tǒng)數(shù)據(jù)樣本相互對(duì)比、相互印證、整合運(yùn)用,以進(jìn)一步增強(qiáng)調(diào)查研究數(shù)據(jù)基礎(chǔ)工作的科學(xué)性。
從因果分析、邏輯推理調(diào)研向關(guān)聯(lián)、非關(guān)聯(lián)等相關(guān)因素呈現(xiàn)式調(diào)研的轉(zhuǎn)變
在傳統(tǒng)的調(diào)查研究中,因果分析、邏輯推理是最重要的研究方法,通過(guò)這種方法得出的結(jié)論往往需要通過(guò)實(shí)踐進(jìn)行驗(yàn)證和修補(bǔ),有的甚至最終會(huì)被證偽、推翻。究其原因,關(guān)鍵在于我們的主觀世界與客觀世界的信息嚴(yán)重不對(duì)稱。客觀世界信息無(wú)限豐富,而我們自身受眼界、技術(shù)、認(rèn)知能力等因素的制約,能夠獲取的信息極為有限,我們只能像管中窺豹或者盲人摸象一樣,憑借經(jīng)驗(yàn)、常識(shí)乃至主觀好惡對(duì)抽樣數(shù)據(jù)進(jìn)行判斷、分析,借以推測(cè)事物的全貌。事實(shí)上,由局部推測(cè)整體的調(diào)查研究始終是存在偏差的,其結(jié)論甚至可能會(huì)與事物的真實(shí)狀況大相徑庭。
大數(shù)據(jù)時(shí)代的調(diào)查研究既不必、也不應(yīng)再拘泥于對(duì)因果關(guān)系的探究,相反,我們完全有條件實(shí)現(xiàn)向關(guān)聯(lián)、非關(guān)聯(lián)等相關(guān)因素呈現(xiàn)式調(diào)研的轉(zhuǎn)變。20世紀(jì)90年代,美國(guó)沃爾瑪超市將A prior算法引入到POS機(jī)數(shù)據(jù)分析中,從10萬(wàn)種以上的商品中發(fā)現(xiàn)了啤酒與尿布的相關(guān)性,于是將兩種商品擺放在一起,從而大幅提高了啤酒的銷售量。類似的案例不勝枚舉。如今,我們也已經(jīng)步入大數(shù)據(jù)時(shí)代,海量數(shù)據(jù)不斷涌現(xiàn),數(shù)據(jù)搜集、存儲(chǔ)、處理能力日益提高。充分利用互聯(lián)網(wǎng)、云計(jì)算等現(xiàn)代化手段,對(duì)海量的數(shù)據(jù)進(jìn)行統(tǒng)計(jì)性的搜索、比較、分析、歸納,我們會(huì)發(fā)現(xiàn),原本似乎毫不相干的事物之間存在著較高的關(guān)聯(lián)度,這是傳統(tǒng)的因果分析、邏輯推理調(diào)研難以解釋也無(wú)法企及的。
從已經(jīng)發(fā)生的歷史靜態(tài)調(diào)研向不斷變化的動(dòng)態(tài)追蹤調(diào)研轉(zhuǎn)變
傳統(tǒng)的調(diào)研方式是對(duì)現(xiàn)狀的梳理、問(wèn)題的分析、情況的總結(jié)和對(duì)策的應(yīng)用,著眼于歷史上已經(jīng)發(fā)生的和現(xiàn)實(shí)存在的種種問(wèn)題,通過(guò)精確的樣本和深度的數(shù)據(jù)挖掘,將不符合要求的樣本過(guò)濾掉,找出現(xiàn)狀、問(wèn)題、原因、建議等之間的“因果關(guān)系”,表現(xiàn)為對(duì)某一時(shí)點(diǎn)的靜態(tài)分析。在大數(shù)據(jù)時(shí)代,由于大數(shù)據(jù)思維強(qiáng)調(diào)的是效率而非精確度,更多的是通過(guò)各種數(shù)據(jù)分析得出某種趨勢(shì)和事物發(fā)展的規(guī)律,這種趨勢(shì)未必要精確,但是能夠讓決策者有足夠的做出某種決定的依據(jù);同時(shí),在大數(shù)據(jù)時(shí)代的調(diào)研更強(qiáng)調(diào)持續(xù)性,由于數(shù)據(jù)來(lái)源廣泛且不斷變化,對(duì)現(xiàn)實(shí)情況的分析、問(wèn)題的查找和建議的提出就要隨著數(shù)據(jù)的變化而不斷變化;更重要的是,這種調(diào)研是著眼于未來(lái),對(duì)于已發(fā)生的情況解釋和問(wèn)題分析都是為了今后事物的發(fā)展、前景和走向,特別是通過(guò)充分的數(shù)據(jù)分析以預(yù)測(cè)的形式表現(xiàn)這種趨勢(shì)。
總之,做好大數(shù)據(jù)時(shí)代的調(diào)研需要“可以利用的大數(shù)據(jù)”,做到調(diào)研方式從依靠人工到基于互聯(lián)網(wǎng)的轉(zhuǎn)變,數(shù)據(jù)基礎(chǔ)從有限樣本到云數(shù)據(jù)、全覆蓋的轉(zhuǎn)變,研究方法從因果關(guān)系到關(guān)聯(lián)關(guān)系等多種分析模式的轉(zhuǎn)變,調(diào)研導(dǎo)向從回顧靜態(tài)歷史到展望動(dòng)態(tài)未來(lái)的轉(zhuǎn)變,并且在這些轉(zhuǎn)變中形成現(xiàn)代化治理體系中的所需要的核心能力。