近年來(lái),大數(shù)據(jù)在我國(guó)得到一致重視,各行各業(yè)興起了一股重視大數(shù)據(jù)、應(yīng)用大數(shù)據(jù)的熱潮。這種全民迅速接受新生事物的現(xiàn)象,反映了中國(guó)經(jīng)過(guò)改革開放,現(xiàn)代化意識(shí)深入人心的可喜狀況,令人鼓舞。但是,由于大數(shù)據(jù)技術(shù)發(fā)展迅速,一些囫圇吞棗的淺知誤見也隨之流傳,如不及時(shí)糾正,將造成對(duì)大數(shù)據(jù)先入為主的誤區(qū),影響經(jīng)濟(jì)社會(huì)發(fā)展。當(dāng)前國(guó)內(nèi)十分流行的《大數(shù)據(jù)時(shí)代》(維克托·邁爾-舍恩伯格等著,浙江人民出版社,2013年,以下簡(jiǎn)稱《時(shí)代》)中提出了三個(gè)存在嚴(yán)重謬誤的觀點(diǎn),特此指出,以期引起注意。
“不是因果關(guān)系,而是相互關(guān)系”?
《時(shí)代》一書的主要觀點(diǎn)之一是,大數(shù)據(jù)時(shí)代“不是因果關(guān)系,而是相互關(guān)系”。其實(shí),早在18世紀(jì),英國(guó)懷疑論者休謨就指出,“不但我們的理性不能幫助我們發(fā)現(xiàn)原因和結(jié)果的最終聯(lián)系,而且經(jīng)驗(yàn)給我們指出它們的恒常結(jié)合以后,我們也不能憑自己的理性使自己相信,我們?yōu)槭裁窗涯欠N經(jīng)驗(yàn)擴(kuò)大到我們所曾觀察過(guò)那些特殊事物以外。我們只是假設(shè),卻永遠(yuǎn)不能證明,我們所經(jīng)驗(yàn)過(guò)的那些事物必然類似于我們所未曾發(fā)現(xiàn)的那些對(duì)象。”
《時(shí)代》一書將這一早已提出幾個(gè)世紀(jì)的觀點(diǎn),作為大數(shù)據(jù)時(shí)代的新概念,不僅陳舊,而且錯(cuò)誤。因?yàn)椋?jiǎn)單地說(shuō)大數(shù)據(jù)時(shí)代“不是因果關(guān)系,而是相互關(guān)系”,說(shuō)明作者不了解因果關(guān)系本身也是一種相互關(guān)系,即原因與結(jié)果前后相繼的相互關(guān)系,因此將因果關(guān)系歸結(jié)為相互關(guān)系并不比因果關(guān)系本身更有內(nèi)涵,實(shí)際上,這甚至是一種同義反復(fù)。
正確的觀點(diǎn)應(yīng)該明確因果關(guān)系是一種什么樣的相互關(guān)系,而這一點(diǎn)經(jīng)過(guò)20世紀(jì)自然科學(xué)和數(shù)理哲學(xué)的研究已經(jīng)有了更深刻的認(rèn)識(shí)。計(jì)算機(jī)的發(fā)明,使得人們開始從計(jì)算機(jī)語(yǔ)言表達(dá)、傳遞信息的角度來(lái)理解知識(shí)的起點(diǎn)。大數(shù)據(jù)時(shí)代的到來(lái),使得人們豁然開朗。
經(jīng)濟(jì)學(xué)者李德偉教授在《時(shí)代》中譯本發(fā)表之前,就已提出大數(shù)據(jù)時(shí)代不再?gòu)?qiáng)調(diào)因果關(guān)系,也不是簡(jiǎn)單地將因果關(guān)系歸為相互關(guān)系,而是精確地指出客觀事物運(yùn)動(dòng)序列之間存在同構(gòu)關(guān)系,特別是人類認(rèn)識(shí)與外部客觀事物之間存在對(duì)應(yīng)的、同構(gòu)的關(guān)系,信息的表達(dá)、傳輸和存儲(chǔ)就是一種同構(gòu)關(guān)系,也就是說(shuō),外部客觀事物運(yùn)動(dòng)與人的主觀認(rèn)識(shí)都是客觀世界的事物現(xiàn)象,是協(xié)調(diào)性的、一一對(duì)應(yīng)的相互關(guān)系,主觀認(rèn)識(shí)映像只是承載、傳遞外部客觀事物現(xiàn)象的一種符號(hào)系統(tǒng)。無(wú)論是從人自身悟出來(lái),還是從外部經(jīng)驗(yàn)事物抽象出來(lái),都是同構(gòu)的、對(duì)應(yīng)的關(guān)系。
“不是隨機(jī)樣本,而是全體數(shù)據(jù)”?
《時(shí)代》一書認(rèn)為大數(shù)據(jù)時(shí)代“不是隨機(jī)樣本,而是全體數(shù)據(jù)”,認(rèn)識(shí)事物不再是從隨機(jī)抽取的部分樣本,而是從全部數(shù)據(jù)出發(fā)。這種說(shuō)法忽視了全部與部分的辯證關(guān)系。人類在有限的時(shí)間內(nèi)不可能窮盡事物的全部,絕對(duì)真理只能在人類前后相繼的、永遠(yuǎn)不會(huì)停止的認(rèn)識(shí)過(guò)程中實(shí)現(xiàn)。任何事物的發(fā)展總是有過(guò)去、現(xiàn)在和未來(lái),現(xiàn)在的是現(xiàn)在,未來(lái)的尚未出現(xiàn),全部案例不可能在有限時(shí)間內(nèi)達(dá)到,認(rèn)識(shí)也永遠(yuǎn)不會(huì)完結(jié)。未來(lái)的與過(guò)去和現(xiàn)在相比還是無(wú)窮大的。正因?yàn)槿绱耍ㄆ諣柌盘岢觯?ldquo;全稱命題不可證實(shí),只能證偽。”
實(shí)際上,過(guò)去的小數(shù)據(jù)時(shí)代的抽樣調(diào)查方法與現(xiàn)在的大數(shù)據(jù)方法相比,只能說(shuō)是大數(shù)據(jù)時(shí)代可以用更為精確的、全面的數(shù)據(jù),以包含更大因素的仿真模型來(lái)追蹤、分析模擬現(xiàn)實(shí),取得比過(guò)去更為精確的認(rèn)識(shí)結(jié)果。盡管如此,與全體相比,已經(jīng)認(rèn)識(shí)的永遠(yuǎn)是少數(shù),誤差、錯(cuò)誤還是不能完全消除。例如,通過(guò)人口普查分析現(xiàn)在中國(guó)人具有什么特點(diǎn)。不要說(shuō)全部認(rèn)識(shí)現(xiàn)有13億人口的全部屬性不可能(因?yàn)槭挛飳傩杂袩o(wú)窮層次),即使說(shuō)能夠完全認(rèn)識(shí)現(xiàn)有13億人口全部屬性,也不意味著過(guò)去、未來(lái)的中國(guó)人,也能夠全部認(rèn)識(shí)。未來(lái)的中國(guó)人與已經(jīng)認(rèn)識(shí)的現(xiàn)有中國(guó)人相比還是無(wú)窮大。因此,大數(shù)據(jù)與小數(shù)據(jù)相比只是以巨量的、全面的、即時(shí)的數(shù)據(jù)來(lái)認(rèn)識(shí)事物,但是要掌握全體數(shù)據(jù)在有限時(shí)間內(nèi)總是不可能的。
“不是精確性,而是混雜性”?
《時(shí)代》作者說(shuō)大數(shù)據(jù)時(shí)代“不是精確性,而是混雜性”,意指小數(shù)據(jù)時(shí)代是講究精確性,大數(shù)據(jù)時(shí)代因?yàn)檎莆樟舜罅繑?shù)據(jù)可以不再拘泥于精確性,而是依靠大數(shù)據(jù)比較模糊地行動(dòng)。這顯然是錯(cuò)誤的。因?yàn)樵谛?shù)據(jù)時(shí)代能夠掌握精確的小數(shù)據(jù),但是大多數(shù)數(shù)據(jù)卻被遺漏、舍棄,認(rèn)識(shí)的結(jié)果就無(wú)法實(shí)現(xiàn)精確、全面,真理和錯(cuò)誤的邊界也不是很清楚,這時(shí)的認(rèn)識(shí)是模糊的、有偏差的。在大數(shù)據(jù)時(shí)代,因?yàn)檎莆樟烁鼮槿娴臄?shù)據(jù),可以在更大的范圍認(rèn)識(shí)事物,因此,能夠更為準(zhǔn)確、量化,以至于對(duì)一些中間模糊區(qū)域也可以得到更為準(zhǔn)確的認(rèn)識(shí),其精確度和模糊度、誤差本身都更為精確量化。例如,在計(jì)算機(jī)信息系統(tǒng)中,發(fā)布更多的信息,通過(guò)反復(fù)比對(duì)、糾錯(cuò)機(jī)制,降低噪音,到達(dá)精確度。這一點(diǎn)在人類的認(rèn)識(shí)活動(dòng)中本來(lái)就是這樣做的,“耳聽為虛”就以“眼見為實(shí)”來(lái)糾錯(cuò),小數(shù)據(jù)一兩個(gè)來(lái)回不可能正確,反復(fù)多次大數(shù)據(jù)比對(duì),就能達(dá)到越來(lái)越高的精確度,誤差率就越來(lái)越小。
中國(guó)人口世界第一,信息產(chǎn)業(yè)市場(chǎng)最大,最有機(jī)會(huì)發(fā)展信息化、大數(shù)據(jù)和智慧化產(chǎn)業(yè)。但中國(guó)目前在對(duì)大數(shù)據(jù)的認(rèn)識(shí)上有一種盲目跟外國(guó)之風(fēng)的傾向。對(duì)于國(guó)外大數(shù)據(jù)理論,我們應(yīng)以批判的眼光保持清醒的認(rèn)識(shí)。