最近一段時間,區塊鏈和大數據這兩大熱詞正在被越來越多地放在一起,隨著各種言論的增多,兩者的關系開始變得撲朔迷離。區塊鏈將與大數據融合發展?區塊鏈最終將重構大數據?圍觀群眾紛紛表示想弄個明白。
“要弄清區塊鏈和大數據的關系,首先要從兩者的不同開始。”從事互聯網技術研究20余年,人稱互聯網技術相面師的中國信息通信研究院云計算與大數據研究所所長何寶宏拋出了這一觀點。他認為,區塊鏈和大數據技術存在一定的共性,但是兩者在技術處理方式上,更多的是不同。
何寶宏 中國信息通信研究院云計算與大數據研究所所長
何寶宏表示,區塊鏈技術是分布式數據存儲、點對點傳輸、共識機制、加密算法等計算機技術的新型應用模式,區塊鏈處理的數據更小,是細致的處理方式。而大數據管理的是海量數據,要求廣度和數量,處理方式上也會粗糙,重點是統計分析(如下圖)。
“這個時代最大的特點就是變化。”對于區塊鏈的興起引發的業界的討論、思考和擔憂,何寶宏認為,我們擅長關注變化的東西,但是實際上很多變化背后的一些東西是不變的,比如——技術的規律。因而,在探討區塊鏈和大數據的關系時,我們需要跳出技術看技術。
客觀而言,作為一個顛覆式的新興技術,區塊鏈要應用在大數據場景下,其本身還還不夠成熟,需要進一步的研究而探討。而區塊鏈是否可能重構大數據?何寶宏認為基本不存在這一可能,因為大數據針對的是非結構化的數據,而區塊鏈處理的是結構化數據。“兩者的目標數據不同,要解決的問題也不同。”
在4月18日-19日即將于北京國家會議中心召開的“2018大數據產業峰會”上,何寶宏將發表題為“預見大數據的2018”的演講,就大數據、區塊鏈等技術發展背后的規律,以及2018年的市場動態和趨勢進行展望。下面,小編收集了何寶宏博士近期的精彩觀點,供大家提前養養眼、洗洗腦。
區塊鏈:互聯網的“大補丁”
草根、全球、自治、分布、開放、透明、對等、匿名、分享……二十年前,人們如此形容互聯網;今天,這些卻成為了區塊鏈身上的標簽。
這是為何?“區塊鏈是互聯網的發展和延續,是互聯網的一塊大補丁。”何寶宏認為,區塊鏈顛覆不了互聯網,更顛覆不了世界。如果非要認為區塊鏈可以顛覆世界,只能說那可能是你的世界太小了。
要為區塊鏈相面,我們能發現很多問題,如:性能低、能耗高、生態鏈、安全防護、隱私保護、監管缺失、標準缺失、不務正業等。“以我20多年的互聯網相面經驗來說,但凡是有這些問題的技術都是‘好技術’,這些缺點隨著時間的推移都是可以克服和解決的。所以,每當有人批評區塊鏈這些缺點時,我都會說這是優秀技術的典型特征。”
相比較區塊鏈這樣的顛覆式技術,何寶宏認為那些注定要失敗的技術往往具備以下特征: 1、聲稱包治百病,一句話說不清楚它希望解決的具體問題;2、概念模糊,一句話說不清楚它的基本思想和原理,與現有技術的明顯區別或邊界;3、準備從主流市場,最賺錢的市場或存量市場開始;4、需要建立以我為中心的生態鏈(技術富二代除外);5、看起來過于完美,沒有明顯的取舍,回避需要付出的技術代價;6、不考慮摩爾定律是否支持;7、經濟學規律模糊,歷史案例牽強。
區塊鏈的本質是分布式賬本。何寶宏認為,分布式賬本是“剛需”。過去的幾百年,我們一直在使用集中式的記賬方式,沒有一種手段能夠支持高效的分布式記賬,直到區塊鏈的出現。
“成年后的技術大多活成自己討厭的樣子。”區塊鏈的特點是去中心化、防篡改、匿名性,但是隨著其不斷成熟和落地,這些特征需要從更深層次去理解。
分布式≠去中心
分布式不等于去中心。“高喊去中心的大多數是自己想成為新的中心。”何寶宏以比特幣為例,其代碼控制在Core小組手中,算力是高度集中的。同時,有報告顯示,40%的比特幣實際上是集中在1000個人手里,而另外一個報告則說,96.53%的比特幣歸屬于4.11%的地址。因而,隨著區塊鏈的發展,去中心正在變成多中心。
防篡改≠不可修改
防篡改不等于不可修改。在何寶宏看來,人會犯錯,數據因而也會出錯。在會計體系里,不允許做假賬但是允許改錯賬。在傳統的數據庫技術中,修改是很容易實現的,因而需要一些管理手段來防止篡改。但是今天,區塊鏈技術是不可修改,那么如果數據出錯了怎么辦?因而需要在不可篡改的技術上加上“可修改”。
保護隱私≠匿名
保護隱私不意味著一定要匿名。何寶宏認為,匿名是保護隱私的一種方法和手段,但不是絕對。二十多年前的互聯網是匿名的、全球化的,誰也關不掉,共享且自治。然而,到了今天,登陸一個網站,你就需要輸入驗證碼,以證明自己是人,而不是機器或其他。
對共識機制難有共識
“對共識機制,難有共識。”何寶宏說,我們需要共識,但我們的共識機制本身卻是分裂的、碎片化的。我們用POW比誰勁大,用POS比誰錢多,這是典型的從原始社會過渡到資本主義社會的“玩法”。后來錢多了人也太多了,于是又用DPOS搞出了代理人機制。
共識機制如何形成共識,屬于控制層面范疇,這個共識特別難。要有這樣的共識就必須要有共識之母,一個共識前面還得有一個共識才能形成后面的共識,共識也是鏈式結構的,信任也是鏈式結構的。因而,說區塊鏈是去信任的,那是不可能的。
小產業、大變革
從技術的角度上看,區塊鏈就是將原來的單個賬本變成了現在的多個賬本。原來,所有的數據庫之間是主從關系,賬本只有一個;今天多個數據庫之間是對等關系,賬本從一個變成多。
從一個會計到多個會計,以前記賬可以讀、寫、改、刪,今天記賬只有讀和寫;以前記賬要給會計發工資,進行外部激勵,我們今天自己激勵就可以了;以前所有公司的商務和財務都是分離的,付賬過程特別繁瑣;今天的智能合約是商務財務一體化,這就顛覆了我們很多的想法。
以前,代碼就是技術;今天,代碼變成了金融產品,所以就出現了新的機會。以前,數據主要是指信息,技術則就是如何幫它更廣泛的傳播;現在數據越來越成為資產,技術的走向就要發生很大的變化。
以前,二進制代碼表達的是信息;今天,二進制代碼表達的是一種財產。數據即資產,資產即數據。當二進制代碼代表資產,技術的核心要義就要走向保護,要去管理和控制。技術的目的從最大限度的傳播,轉為考慮如何把代碼圈起來。
區塊鏈是小產業、大變革。它顛覆的是我們的經濟、經濟運營最底層的復式記賬法。我們用了幾百年的復式記賬法將演進為三式記賬法。