大數(shù)據(jù)開啟了信息文明,而信息文明正是更深入理解大數(shù)據(jù)的重要進路。人類信息文明之所以為大數(shù)據(jù)所開啟,與大數(shù)據(jù)本身的深層內(nèi)涵密切相關(guān)。
自第三次工業(yè)革命以來,信息化就使人類開始走向信息文明,但只是到大數(shù)據(jù)時代,才有了信息文明的真正奠基。信息技術(shù)發(fā)展的摩爾定律,使大數(shù)據(jù)呈加速度發(fā)展趨勢。
作為更高層次的人類文明,信息文明的基礎(chǔ)包括網(wǎng)絡(luò)和大數(shù)據(jù)。網(wǎng)絡(luò)是信息文明的物能基礎(chǔ),如果沒有網(wǎng)絡(luò),人類就不可能主要以信息方式生存。大數(shù)據(jù)為信息文明提供信息基礎(chǔ)。作為信息文明社會中人和自然、人和社會特別是人和人之間關(guān)系的量化,大數(shù)據(jù)是信息文明的信息關(guān)系基礎(chǔ)。沒有大數(shù)據(jù),人就不可能成為信息文明意義上“一切社會關(guān)系的總和”。
談到大數(shù)據(jù),似乎更多與技術(shù)相關(guān)聯(lián),但事實上,作為信息文明的基礎(chǔ),大數(shù)據(jù)的深層內(nèi)涵具有遠比技術(shù)更基礎(chǔ)的劃時代意義。
首先,大數(shù)據(jù)具有規(guī)模整全性,它構(gòu)成信息文明的本體基礎(chǔ)。大數(shù)據(jù)的“大”不僅意味著數(shù)據(jù)量大,而且意味著維度全。而大數(shù)據(jù)之所以維度全,則因為大數(shù)據(jù)的獲取只有最基本因而也是最少的在先設(shè)定。所有數(shù)據(jù)的獲取都有在先設(shè)定,關(guān)鍵是在先設(shè)定的層次。而大數(shù)據(jù)由于不必有像取樣那樣的具體預(yù)設(shè),其在先設(shè)定一般都到了哲學(xué)層次。在先預(yù)設(shè)越基本從而越少,數(shù)據(jù)相應(yīng)維度就越全。雖然不存在完全意義上的全數(shù)據(jù),就像不存在十全十美的事物,但以人類使用為標(biāo)準(zhǔn),則可以就使用需要把大數(shù)據(jù)看作是全數(shù)據(jù)。大數(shù)據(jù)與小數(shù)據(jù)的根本區(qū)別,就在于大數(shù)據(jù)不是根據(jù)預(yù)先設(shè)定的具體目的由抽樣形成的干枯數(shù)據(jù)標(biāo)本,而是動態(tài)反映事物相互作用過程的數(shù)據(jù)流。
作為人類信息文明的基礎(chǔ),大數(shù)據(jù)整全性的另一個更重要特性,則是與技術(shù)設(shè)備的數(shù)據(jù)處理速度密切相關(guān)。對于人類來說,大數(shù)據(jù)不僅取決于數(shù)據(jù)本身,而且取決于技術(shù)設(shè)備的數(shù)據(jù)處理速度,數(shù)據(jù)處理速度決定了實時數(shù)據(jù)流狀態(tài)。在此意義上,大數(shù)據(jù)涉及其與人類使用的關(guān)系。樣本數(shù)據(jù)在取樣后就與時間沒有了實時關(guān)聯(lián),而大數(shù)據(jù)則是實時數(shù)據(jù)流。在小數(shù)據(jù)時代,我們只是獲取標(biāo)本;而在大數(shù)據(jù)時代,我們所獲得的則是一個生存的數(shù)據(jù)基礎(chǔ)。正是高速流動的數(shù)據(jù),為我們提供了現(xiàn)實的無限可能性空間。大數(shù)據(jù)的整全性就包括數(shù)據(jù)流速這個至關(guān)重要的維度。這種不是凝固而是可以看作是自然生成的數(shù)據(jù)流,隨著信息文明的發(fā)展,將越來越成為人類生存的主要基礎(chǔ)。
其次,大數(shù)據(jù)具有結(jié)構(gòu)開放性,它構(gòu)成信息文明的創(chuàng)構(gòu)基礎(chǔ)。大數(shù)據(jù)不只是最初的文本,而是來自商業(yè)過程、機器、網(wǎng)絡(luò)和移動設(shè)備的人類互作,包括電子郵件、照片、音頻、視頻等。大數(shù)據(jù)不僅具有來源和類型的多樣性,甚至也不只是數(shù)據(jù)的結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化,而是意味著數(shù)據(jù)結(jié)構(gòu)的開放性。數(shù)據(jù)結(jié)構(gòu)不是完全決定于數(shù)據(jù)本身,而是涉及大數(shù)據(jù)相關(guān)關(guān)系的理解。由于大數(shù)據(jù)的特點之一是數(shù)據(jù)太多,信息不足,大數(shù)據(jù)“難”在理解,因而數(shù)據(jù)挖掘與人的理解能力密切相關(guān)。
最后,大數(shù)據(jù)具有價值生產(chǎn)性,它構(gòu)成信息文明的意義生產(chǎn)基礎(chǔ)。相對于取樣數(shù)據(jù)價值密度低,數(shù)據(jù)挖掘是沙里淘金,大數(shù)據(jù)的意義與人的需要的關(guān)聯(lián)性,決定了大數(shù)據(jù)具有與人及其需要的發(fā)展內(nèi)在相關(guān)的價值生產(chǎn)性。大數(shù)據(jù)的價值生產(chǎn)性,建立在其規(guī)模整全性和結(jié)構(gòu)開放性的基礎(chǔ)之上。理解大數(shù)據(jù)的價值,關(guān)鍵就在于把握相關(guān)關(guān)系組合與人的需要及其發(fā)展的關(guān)系。
我們可以從兩個層次研究大數(shù)據(jù):技術(shù)手段和信息文明基礎(chǔ)。作為信息文明的基礎(chǔ),大數(shù)據(jù)上啟信息文明,下承信息哲學(xué)。大數(shù)據(jù)相關(guān)關(guān)系與人的需要及其發(fā)展之間的價值生產(chǎn)空間,不僅對大數(shù)據(jù)的哲學(xué)研究,而且對一般意義上的哲學(xué)研究都具有深刻啟示。
(作者:上海大學(xué)社會科學(xué)學(xué)部 王天恩)