區塊鏈和大數據都是熱門的話題,很多人把他們放在一起討論,希望能碰撞出更多的熱點。大數據發展早于區塊鏈,目前已經成為一個龐大的產業。而區塊鏈處在產業的初期,很多技術和商業模式還在探索之中。
鑒于大數據產業相對比較成熟,我們以大數據為出發點,來看一下區塊鏈技術如何與大數據產業的各個環節進行對接。
大數據核心產業鏈條可以大致分為以下三部分:
產品部分:包括大數據基礎軟件、大數據應用軟件等大數據軟件產品相關產業。
數據部分:包括數據源(數據采集、數據提供)、數據流通(數據交易、數據共享)等與數據直接相關的產業。
服務部分:包括大數據基礎設施服務(數據存儲、數據傳輸、數據清洗、數據脫敏等)、大數據分析服務以及大數據應用服務等服務類相關產業。
01 產品部分
軟件產品和區塊鏈的結合,其結合點應該是在技術方面。大數據技術與區塊鏈技術中有相似點:都是分布式架構。
然而他們又有很明顯的不同點:大數據技術中使用分布式技術是為了計算資源——利用多臺機器的計算資源,將單機無法處理完成的任務,分配給多臺計算機完成,每臺計算機通過處理不同的任務,整合多臺計算資源,形成強大的數據處理能力。
而區塊鏈使用分布式技術是為了讓多個主體能夠相互信任——每個主體通過自己控制的計算機參與到整個區塊鏈的運行中,每臺計算機運行的任務基本相同,整個區塊鏈通過大量重復冗余的計算,實現多主體之間的相互信任。
從技術角度看,大數據技術用信任換取了計算資源,而區塊鏈技術用計算資源換取了信任。由于兩者之間的這種區別,在技術上,大數據和區塊鏈很難找到合適的碰撞點。
02 數據部分
在數據部分的多種業態中,區塊鏈都能找到其用武之地。
數據源:如果數據是由單個主體所采集收集的,不涉及到信任問題,引入區塊鏈的意義不大。但如果涉及到多個主體進行數據采集、提供數據的情況,區塊鏈就可以發揮它的作用了。
為了解決多主體之間的信任問題,每個主體都將自己采集到的數據廣播給所有使用方,并將數據的Hash值保存在區塊鏈上。區塊鏈上的每個主體都可以根據區塊鏈上的Hash值,驗證自己收到的完整數據是否被篡改。區塊鏈的可追溯性和防抵賴性,讓多方提供數據時更加可信。同時,這種方式也有助于維護大數據的完整性。
而在數據流通行業,區塊鏈能起到的作用就更大了。在大數據流通行業中,大數據本身就是一種數字資產。數字資產的交易,可以通過區塊鏈實現。并且,在區塊鏈上實現的去中心化大數據交易,可以減少原始數據的接觸者。在一個去中心化的交易平臺上,只有買賣雙方可以接觸到原始數據;而在中心化的交易平臺上,作為交易中心的數據中介通常也會接觸到原始數據,這就增加了數據泄露、資產損失的風險。
03 服務部分
在大數據服務中,服務能力作為一種數字資產,與數據交易中的數據即為資產的理念是一樣的,都可以進行交易。
而區塊鏈在這種數字資產的交易中,就能夠發揮重要的作用。同時,近期又有很多新的技術在不斷改變著區塊鏈,例如同態加密技術。同態加密是區塊鏈與大數據服務結合的一個重要技術點,同態加密能夠真正實現將數據的服務能力轉化為數字資產,同時又不會有服務中原始數據被大數據服務商拷貝的風險。
綜上所述,區塊鏈與大數據還是有很多碰撞點的。本文只是分析了用區塊鏈技術去碰大數據產業的情況,而用大數據技術碰區塊鏈產業,也同樣有大量的熱點,我們在今后的文章中會討論到這個問題。