各個維度對 區(qū)塊鏈 進行了詳細闡述,那么大數據又是什么呢?現在很多人都認為,大數據的本質是「大」。也就是說,它的數據量必須非常的廣泛和巨大,可能是海量級的。其實這并不準確。
大數據所指的「大」其實更偏向于全,也就是盡可能地接近某個統(tǒng)計范疇內最全面的數據,甚至達到全數據的統(tǒng)計結果。只有這樣才能真正實現大數據的基本目標。
例如,在一個重大的政治事件發(fā)生之前多少年,會發(fā)生一次旱災,或者一次重大疾病的流行對宗教的傳播有什么影響。以這樣的模式,這位歷史學家對過去幾千年的人類歷史進行了一次梳理和分析。結果他發(fā)現了一個預測模式,通過這個模式,他甚至可以預測未來的某一年,在世界上的某個國家會發(fā)生什么樣的重大歷史事件,而這種預測的準確率達到了一個很高的水平。
因此我們可以認為,假如有足夠多的數據量,就可能對世界上所有即將發(fā)生的事情進行預測。如果能夠做到這一點,那么無疑我們將控制整個世界的變遷。
這要怎么做到呢?要實現這一點需要不斷提取盡可能多的數據。
區(qū)塊鏈是一種按照時間順序將數據區(qū)塊以順序相連的方式組合成的一種鏈式數據結構,并以密碼學方式保證的不可篡改和不可偽造的分布式賬本。廣義來講, 區(qū)塊鏈 技術是利用塊鏈式數據結構來驗證與存儲數據、利用分布式節(jié)點共識算法來生成和更新數據、利用密碼學的方式保證數據傳輸和訪問的安全、利用由自動化腳本代碼組成的智能合約來編程和操作數據的一種全新的分布式基礎架構與計算范式。
通過 區(qū)塊鏈 模式,可以盡可能地將那些非結構化的數據進行結構化處理。通過將現有各種數據拆解并存儲于各個存儲單元,我們能對整個世界的數據模式有更加清晰的認知。
既然說到 區(qū)塊鏈 ,那么要解決的一個問題必然是信息的安全性問題。 區(qū)塊鏈 在這方面所能起到的作用是不可替代的。通過將 區(qū)塊鏈 應用到各種數據的提取過程中,就可以實現我們對各種研究所需的非結構化數據的集中使用,而不用擔心這些數據被肆意傳播和濫用。這也就預防了可能出現的數據風險。
當然, 區(qū)塊鏈也可能帶來另外的問題。
在大數據研究中,有的時候我們需要對某一群體的特征進行精確的分析和描繪。但是大數據要求的這種數據模式,在 區(qū)塊鏈 中卻很難實現。比如說,我們要確認一組人群——80后或者90后——他們在職場中真正面臨的困境是些什么。通過對這個問題的進一步細致和深化,我們就可以把分布式存儲在各個領域里的、關于各種各樣情境的困惑集中起來,形成我們的結論。
但如果再進一步,想了解某一家企業(yè)、一個群體或者某一個具體區(qū)域的人群的特點,我們就無法得到有效的數據標簽來實現分析了。
換句話說, 區(qū)塊鏈 通過犧牲數據的個性化標簽來實現我們對某一類問題進行系統(tǒng)研究的可能性,但是同時也讓我們在進一步的分析過程中,遭遇數據提取的困難。
總體來說, 區(qū)塊鏈 還是為大數據研究提供了一種非常有效的支撐。它可以幫助我們更好地實現大數據的應用,也解決了各種數據之間橫向遷移時的壁壘。
而另一方面,大數據也為 區(qū)塊鏈 的應用提供了更好的支撐。
從目前的情況來看, 區(qū)塊鏈 的應用范圍依然比較狹窄。雖然它在很多領域中都有非常好的前景和解決具體問題的能力,但是具體到某個領域的時候, 區(qū)塊鏈 卻總是很難實現目標。
與之相反,大數據的應用事實上已經被很多人所接受。尤其在商業(yè)領域,通過大數據分析實現商業(yè)競爭的目標,也成為很多企業(yè)的首選做法。在這種環(huán)境下,如果 區(qū)塊鏈 能夠給大數據的研究提供更好的支撐,可能就會帶來對 區(qū)塊鏈 應用需求的上升,這事實上可以為 區(qū)塊鏈 的應用和推廣帶來非常好的推動作用。
相關媒體認為 區(qū)塊鏈 與大數據的整合,在未來將是一個必然的趨勢,大數據的研究將越來越深入地觸及人類社會的底線。我們的隱私、數據權利和思想權,都將成為討論的范疇。