伴隨著互聯(lián)網(wǎng)的深度覆蓋和計(jì)算機(jī)技術(shù)的飛速發(fā)展,人類社會(huì)迅速進(jìn)入到一個(gè)全新的信息化時(shí)代,“大數(shù)據(jù)”無(wú)疑成為當(dāng)今互聯(lián)網(wǎng)世界中的“新寵”。從數(shù)據(jù)特征來(lái)看,大數(shù)據(jù)具有常見的5V特征,即容量大(Volume)、類型多(Variety)、時(shí)效性高(Velocity)、準(zhǔn)確性高(Veracity)和價(jià)值密度低(Value)。這些全新的數(shù)據(jù)特征使得業(yè)界對(duì)大數(shù)據(jù)的研究應(yīng)用增長(zhǎng)迅速,衍生出機(jī)器學(xué)習(xí)、人工智能等若干領(lǐng)域,并在消費(fèi)者行為偏好等領(lǐng)域?qū)崿F(xiàn)較為成熟的應(yīng)用。
挑戰(zhàn)傳統(tǒng)量化研究思路
目前,社會(huì)科學(xué)領(lǐng)域?qū)Υ髷?shù)據(jù)的研究還處于起步和成長(zhǎng)階段。相較于大數(shù)據(jù)在商業(yè)領(lǐng)域的數(shù)據(jù)特征,在社會(huì)科學(xué)研究層面,大數(shù)據(jù)具有兩方面的顯著特征:一是全數(shù)據(jù)特征。大數(shù)據(jù)采集效率高,能夠直接獲取總體數(shù)據(jù),區(qū)別于傳統(tǒng)有限規(guī)模的抽樣調(diào)查數(shù)據(jù)。二是非結(jié)構(gòu)化和半結(jié)構(gòu)化的數(shù)據(jù)形式,區(qū)別于傳統(tǒng)的結(jié)構(gòu)化數(shù)據(jù),更為豐富的過(guò)程數(shù)據(jù)、文本數(shù)據(jù)都可以進(jìn)入研究的范疇。這兩個(gè)特征極大地挑戰(zhàn)了傳統(tǒng)社會(huì)科學(xué)量化研究的思路,同時(shí)也給未來(lái)社會(huì)科學(xué)研究的突破性發(fā)展帶來(lái)了新機(jī)遇。
在社會(huì)科學(xué)各學(xué)科中,政治學(xué)是較早應(yīng)用大數(shù)據(jù)方法的學(xué)科之一,這與其學(xué)科特征緊密關(guān)聯(lián)。作為引領(lǐng)政治學(xué)方向的美國(guó)政治學(xué)研究向來(lái)注重量化研究方法,對(duì)新技術(shù)的應(yīng)用總是走在各學(xué)科前沿;而政治現(xiàn)象的復(fù)雜性和一定程度上的顯學(xué)特征,也使得政治學(xué)界對(duì)新技術(shù)的出現(xiàn)和應(yīng)用充滿期待。因此,大數(shù)據(jù)在政治學(xué)領(lǐng)域的應(yīng)用相對(duì)走在社會(huì)科學(xué)各學(xué)科前沿,在宏觀的社會(huì)運(yùn)動(dòng)研究和微觀的大眾研究層面都收獲了許多具有典型意義的成果,推動(dòng)了政治學(xué)方法論的更新和進(jìn)步。
改變宏觀微觀研究范式
社會(huì)運(yùn)動(dòng)等宏大主題是政治學(xué)經(jīng)常關(guān)注的話題,但對(duì)這一議題的研究卻常常受到數(shù)據(jù)采集難度大、空間結(jié)構(gòu)分析困難等因素的影響,使得研究受到局限。尤其是隨著網(wǎng)絡(luò)政治的興起,對(duì)網(wǎng)絡(luò)社會(huì)運(yùn)動(dòng)的研究和分析還很不足。大數(shù)據(jù)帶來(lái)的數(shù)據(jù)采集和分析方法上的進(jìn)步,使得政治學(xué)對(duì)社會(huì)運(yùn)動(dòng)更為精確的研究和預(yù)測(cè)變得可能。在分析方法上,大數(shù)據(jù)所推動(dòng)的大規(guī)模社會(huì)網(wǎng)絡(luò)分析、自動(dòng)文本分析、情感分析、機(jī)器學(xué)習(xí)等方法的運(yùn)用和普及,使得對(duì)社會(huì)運(yùn)動(dòng)研究過(guò)程的刻畫更為精細(xì),研究角度也更為多元。
利用大數(shù)據(jù)的這種優(yōu)勢(shì),當(dāng)前已有不少研究探討了社會(huì)事件的起因和結(jié)構(gòu)。這些研究拓展了對(duì)社會(huì)運(yùn)動(dòng)的研究方式,增進(jìn)了政治學(xué)對(duì)社會(huì)運(yùn)動(dòng)尤其是網(wǎng)絡(luò)社會(huì)運(yùn)動(dòng)議題的研究,在理論和應(yīng)用層面都發(fā)揮了重要作用。
傳統(tǒng)的大眾研究往往以調(diào)查數(shù)據(jù)為基礎(chǔ),以標(biāo)準(zhǔn)化的問(wèn)卷獲取大眾的政治傾向、政治參與、政治滿意度等信息。受制于調(diào)查問(wèn)卷的規(guī)模和高額的調(diào)查成本,樣本規(guī)模和問(wèn)卷內(nèi)容都非常有限。而無(wú)論是面對(duì)面的直接訪問(wèn)還是電話調(diào)查或者是網(wǎng)絡(luò)調(diào)查,數(shù)據(jù)不可避免地要受到調(diào)查質(zhì)量以及受訪者的社會(huì)意愿偏差、記憶偏差等因素的影響,使得數(shù)據(jù)結(jié)果容易受到質(zhì)疑。
大數(shù)據(jù)方法的出現(xiàn),刷新了傳統(tǒng)的數(shù)據(jù)獲取方式和所能獲得的數(shù)據(jù)類型。這使得數(shù)據(jù)庫(kù)可以突破抽樣的限制,數(shù)據(jù)規(guī)模大為擴(kuò)展,便利了對(duì)事實(shí)的描述分析;更為豐富的數(shù)據(jù)類型也使得政治學(xué)研究能夠更進(jìn)一步探測(cè)民眾的政治偏好、政治行為、情感取向以及政治互動(dòng)等多方面的情況。當(dāng)前,已有不少這類研究出現(xiàn),比如有西方學(xué)者利用機(jī)器學(xué)習(xí)和社會(huì)網(wǎng)絡(luò)分析,來(lái)推測(cè)微博用戶的黨派身份,并分析他們的政黨同質(zhì)性水平;也有中國(guó)學(xué)者通過(guò)對(duì)政府網(wǎng)絡(luò)留言板上的發(fā)帖內(nèi)容分析,探究公民網(wǎng)絡(luò)訴求的表達(dá)策略等。
政治學(xué)方法論:跨學(xué)科趨勢(shì)
從政治學(xué)方法論角度來(lái)看,“量化”已經(jīng)是政治科學(xué)研究方法中的主要成分,而大數(shù)據(jù)進(jìn)一步推動(dòng)了量化方法的升級(jí)和擴(kuò)展,這使傳統(tǒng)的量化方法重點(diǎn)——因果推論上也取得了諸多進(jìn)展。首先,就因果推論中常用的匹配法而言,傳統(tǒng)的匹配方法容易受到樣本規(guī)模的極大制約,尤其是對(duì)于小規(guī)模群體而言,匹配方法在傳統(tǒng)樣本規(guī)模下很難實(shí)現(xiàn);而大數(shù)據(jù)在數(shù)據(jù)規(guī)模上的優(yōu)勢(shì),使得小規(guī)模群體的數(shù)量規(guī)模也相應(yīng)變大,使匹配成為可能。其次,就因果推論中的實(shí)驗(yàn)方法而言,大數(shù)據(jù)也展現(xiàn)出其優(yōu)勢(shì):傳統(tǒng)的調(diào)查實(shí)驗(yàn)和田野實(shí)驗(yàn)方法成本高且實(shí)施難度較大,而大數(shù)據(jù)方法多借助于計(jì)算機(jī)技術(shù)和互聯(lián)網(wǎng),實(shí)驗(yàn)干預(yù)手段相對(duì)便捷,成本也更為低廉,一定程度上打破了實(shí)驗(yàn)設(shè)計(jì)的高額成本門檻,提供了探究因果關(guān)系的新選擇。
大數(shù)據(jù)帶來(lái)的數(shù)據(jù)開發(fā)和研究前景使得政治學(xué)與自然科學(xué)各學(xué)科的結(jié)合更為緊密,使得政治學(xué)向科學(xué)的方向更進(jìn)一步。傳統(tǒng)意義上,文本挖掘、機(jī)器學(xué)習(xí)、編程等概念似乎是自然科學(xué)中才會(huì)涉及的概念和方法,與社會(huì)科學(xué)有著較遠(yuǎn)的距離。但大數(shù)據(jù)時(shí)代的到來(lái),很大程度上打破了這種文理界限,不僅要求社會(huì)科學(xué)學(xué)者具備一定的計(jì)算機(jī)技能,而且能夠應(yīng)對(duì)網(wǎng)絡(luò)情況下的數(shù)據(jù)采集和分析方式。這對(duì)政治學(xué)者的挑戰(zhàn)是巨大的:政治學(xué)者關(guān)注的對(duì)象是更為抽象的政治話題,要處理的是更為復(fù)雜的文本、話語(yǔ)、情感等數(shù)據(jù),需要掌握和開發(fā)“非本專業(yè)”的數(shù)據(jù)處理方法。這使得政治學(xué)者面臨著技能上的極大挑戰(zhàn),而主動(dòng)學(xué)習(xí)和跨學(xué)科合作研究則是必由之路。
此外,在政治學(xué)研究中,也要審慎使用大數(shù)據(jù)。大數(shù)據(jù)帶來(lái)的強(qiáng)大數(shù)據(jù)采集和分析能力,以及學(xué)界對(duì)大數(shù)據(jù)方法的不斷開發(fā)利用,使得大數(shù)據(jù)的開發(fā)和應(yīng)用方法不斷成熟,并處于不斷前進(jìn)的過(guò)程,為政治學(xué)的發(fā)展提供了新引擎,帶動(dòng)了傳統(tǒng)研究的更新進(jìn)步,也開拓了新的研究領(lǐng)域。但是,伴隨著政治學(xué)研究的進(jìn)一步科學(xué)化,也要警惕大數(shù)據(jù)應(yīng)用中存在的風(fēng)險(xiǎn)。當(dāng)前,在政治學(xué)的應(yīng)用中,大數(shù)據(jù)方法是實(shí)驗(yàn)干預(yù)的重要方式。但這種方式往往有著較大的人群影響規(guī)模,使得實(shí)驗(yàn)效果有可能突破研究的范疇,對(duì)現(xiàn)實(shí)的政治和社會(huì)運(yùn)行帶來(lái)一定的影響。因此,對(duì)大數(shù)據(jù)實(shí)驗(yàn)手段的使用,要充分考慮到可能的現(xiàn)實(shí)不利影響而對(duì)其審慎使用。
(作者單位:北京外國(guó)語(yǔ)大學(xué)國(guó)際關(guān)系學(xué)院)