數(shù)據(jù)絕對不是一個緯度的,今天的大數(shù)據(jù)之所以這么有用,是因為能夠在多個緯度發(fā)生新的作用。
“大數(shù)據(jù)的故事”,什么叫做故事,故事是需要有情節(jié)、要用感情來打動人,大家知道數(shù)據(jù)是枯燥的,數(shù)據(jù)是生硬的,數(shù)據(jù)是冰冷的,數(shù)據(jù)是沒有溫度的。聽到標題的時候我想到一句話,去年有一個流行的電影叫做《后會無期》,里面有一句話,年輕人喜歡分對錯,成年人只看利弊。我講的是“年輕人喜歡聽故事,成年人只看數(shù)據(jù)”。為什么?因為數(shù)據(jù)代表了理性的分析,這跟故事完全是背道而馳的,故事是靠情感,數(shù)據(jù)是靠理性。挑戰(zhàn)就在這里,我今天要把情感和理性融在一起講數(shù)據(jù)的故事。
我準備了兩組故事,第一組是現(xiàn)代的故事,第二組是古老的故事。第一組現(xiàn)代的故事,我們講去年發(fā)生的很多事,大家記得嗎?有一件事是世界各個地方出現(xiàn)了很多月全食現(xiàn)象,當月全食出現(xiàn)的時候,無數(shù)臺手機對著月亮,世界各地的人都拍下了照片。而且這些照片同時奔涌到云上面,可能是蘋果云,可能是阿里云。現(xiàn)在的天文學家已經(jīng)意識到這些照片加總起來,比任何一臺天文望遠鏡都要強大。因為他們記錄了月亮在不同的地點,不同的角度的形態(tài),他們提供了巨大 的研究價值。
第二個故事,還是去年,舊金山附近發(fā)生了一場地震。那時候我還在舊金山,晚上3點多發(fā)生的地震。地震的第二天有一個可穿戴設備的制造商發(fā)布了一組大數(shù)據(jù),他們發(fā)現(xiàn)通過他們的可穿戴式設備可以知道地震的一剎那有多少人醒了,多少人翻身,你能夠看到隨著離震源的距離不斷變遠,醒的人越來越少。這給我們什么啟示?這是人類歷史上第一次能夠掌握說有一天晚上我們知道這個地方有多少人睡著了、有多少人醒著、他們什么時候醒的,這是一件很恐怖的事情。為什么?這些數(shù)據(jù)可以解釋很多的問題,例如為什么第二天交通事故會增多?心理學家、社會學家還可以用這些數(shù)據(jù)解釋更多的問題。這是我們以前不能想像的。
這兩個故事給我們什么啟發(fā)呢?我想提出的概念是“數(shù)據(jù)外部性”。
剛剛講的拍照是什么?給月亮拍照是為了娛樂,為了分享,最后照片匯總到一起的時候卻帶來了研究的價值,沒有任何一臺天文望遠鏡如此強大。為什么你要戴可穿戴式設備?你是要收集監(jiān)控你的個人健康的情況。當這些數(shù)據(jù)加總到一起的時候會發(fā)現(xiàn)那天晚上有多少人醒著。這就是數(shù)據(jù)的外部性。數(shù)據(jù)的作用能夠超脫它最初收集的目的,你收集數(shù)據(jù)是為了這個目的,但是事實上可以用到另外的緯度,通過不同緯度的應用,數(shù)據(jù)作用和價值能夠層層放大、不斷繁衍、擴大。
我們再講一個真實的故事,發(fā)生在我們身邊的故事。最近嘉興一個年輕人回到家里,發(fā)現(xiàn)父母兩個人都已經(jīng)在家中去世多日了,父親因為身體不健康,洗澡出來摔倒在地死亡了,母親因為癱瘓在床上無人照顧,餓死了。這是一則真實的故事,未來會不會發(fā)生改變?當可穿戴式設備普及的時候,最早發(fā)現(xiàn)人死亡的可能不是你的親人,是大數(shù)據(jù),是云。
剛才講的是一組現(xiàn)代的故事。我們再把視線拉遠,看看古老的故事。
大家知道最早的大數(shù)據(jù)是人口普查的數(shù)據(jù),人口普查要為全國每一個人去建一個檔案,建一個數(shù)據(jù)記錄。美國人在建國的時候就把人口普查的制度寫進了《憲法》,這是1780年代干的事情。為什么要寫入《憲法》?當時美國人花了很多時間建國,在賓西法尼亞州爭論,這幫建國之父,他們?yōu)槭裁匆讶丝谄詹閷懭搿稇椃ā罚克麄兠媾R的問題是國家怎么治理,權力怎么分配,他們要實行代議制,這是按照人口的基數(shù)來選舉代表。這就要首先把全國的人口算清楚,才能實行民主代議、選舉代表。大家知道在200年前要把一個國家的人口算清楚是非常不容易的事情,美國當時一次人口普查要做幾年才能把全國的人算清楚。
但是,隨著歷史的車輪不斷地向前推進的時候,人口普查發(fā)生了很多很微妙的作用。比如說南北戰(zhàn)爭的時候,南方跟北方打仗是因為奴隸制。因為南方想保留奴隸制,北方不同意,雙方開火了。最后南方被北方擊敗了。事實上回到歷史仔細審視,南方并不是被北方擊敗的,而是被人口普查的制度擊敗的。為什么這么講?回到剛才講的美國的政治制度是怎樣的,是按照人口來選舉議員的,最早的時候南方跟北方在議會里面是人數(shù)相當?shù)模髞碓絹碓蕉嗟囊泼衽艿搅吮狈剑狈降娜丝谠絹碓蕉啵麄兊拇砭驮絹碓蕉啵斈戏街辣狈饺丝诘幕鶖?shù)已經(jīng)遠遠超過他們的時候,國會一投票,奴隸制肯定被費除,南方?jīng)]有選擇,只有分裂出去。所以說南方最大的敵人,不是北方,而是人口普查的大數(shù)據(jù)。
繼續(xù)往前看,美國的人口普查,雖然開始只是僅僅為了數(shù)據(jù)分權,只是為了分配權力,他們后來發(fā)現(xiàn)作用非常大,發(fā)現(xiàn)數(shù)據(jù)太有用了,為社會治理提供了方方面面的基礎。所以每10年的人口普查國會都要辯論,辯論到什么要普查,什么不普查,最早的只有幾十個問題,到1860年、1870年的時候,美國人口普查已經(jīng)上升到1萬個問題了,一次普查要用7到9年的時間,全部人口普查的數(shù)據(jù)才能處理完,才能做一個報告出來。大家可以想像,每十年調查一次,九年才能出報告,報告出來新的調查又開始,所以國會每十年都要爭論,這個調查還有沒有價值,要不要做。因為九年的壓力,最后推動了美國的技術創(chuàng)新。在1890年的時候,美國人發(fā)明了打孔制表機,用卡片來處理這些數(shù)據(jù),把所有的數(shù)據(jù)都轉換成0和1,這是計算機最早的雛形。打孔制表機產(chǎn)生之后為后來的計算機提供了基礎。計算機為什么在美國產(chǎn)生,第一臺計算機在1946年產(chǎn)生,首先是沿襲了打孔制表機的二進制。還有,這臺計算機的產(chǎn)生源于一個軍方項目,其中的兩個工程師,都沒有拿到任何的專利,他們憤而下海,下海之后找的第一個客戶是美國的人口普查局。全世界第一臺商業(yè)電腦就是用來處理人口普查數(shù)據(jù)的。美國人口普查最早是為了權力的分配,最后催生和推動了技術的創(chuàng)新,直接引領人類進入計算機時代。
這個故事我想說明的還是數(shù)據(jù)的外部性。數(shù)據(jù)絕對不是一個緯度的,今天的大數(shù)據(jù)之所以這么有用,是因為能夠在多個緯度發(fā)生新的作用。
最后回到現(xiàn)代,以一個故事來結束今天的分享。我們知道電子商務。電商在做什么?每消費一件產(chǎn)品的時候,互聯(lián)網(wǎng)上會留下一條數(shù)據(jù)的記錄,這是電商跟實體商店最本質的區(qū)別。實體商店沒有辦法做到這一點,你要問任何一家實體店的老板你的貨賣到哪里去了,他只知道北京賣了這么多,江西賣了這么多,他不知道每一件貨賣到了哪一個人,但是在互聯(lián)網(wǎng)上的電商我們是有渠道知道每一件貨賣到了誰。這就給你的營銷帶來了黏性,帶來了洞察,帶來了預測!我們講互聯(lián)網(wǎng)化其實本質就是數(shù)據(jù)化。如果今天有一個實體商店他可能把自己所有的消費行為和生產(chǎn)行為全部都數(shù)據(jù)化的話,自然就超越了互聯(lián)網(wǎng)化。回到阿里巴巴,阿里巴巴把這些數(shù)據(jù)記錄下來之后,在幾年之前,在2010年我們發(fā)現(xiàn)數(shù)據(jù)有新的作用。你記錄了一個門店所有的消費行為,他購買的行為,他賣出的行為,我們就可以利用這些數(shù)據(jù)來判斷他的信用。阿里巴巴在四年之前推出了阿里小貸,今天為幾十萬的客戶發(fā)放貸款。這些數(shù)據(jù)來源最早是電商的數(shù)據(jù)。電商收集這些數(shù)據(jù)最早的目的只是為了記錄這些消費行為,但是這些數(shù)據(jù)產(chǎn)生了新的價值。這也是數(shù)據(jù)的外部性。
我們不僅要把這種技術推廣到平臺上的電商,還要推廣到平臺上的消費者,用數(shù)據(jù)去量化一個人的信用。為更多的群體,為更多的人去提供服務。我相信我們今天講互聯(lián)網(wǎng)經(jīng)濟,信用是整個互聯(lián)網(wǎng)經(jīng)濟的一個基礎。