論壇演講實錄:
在去年一年我做了好多次大數據的演講,甚至有一次是在服裝行業的會議上,大概是去年8月份的樣子,那時候他們都已經非常重視大數據了。最近有幾個點被說的太濫,什么都說大數據,什么都說互聯網思維等等。我們今天是一個論壇沙龍會議,而且來了這么多大家耳熟能詳的嘉賓,我就拋磚引玉,跟大家分享一下我對于大數據思維認識的幾個點。
第一:大數據有什么不重要,怎么用很重要。
這是對應一個誤區,很多人把大數據認為成是數據大。舉一個非常有名的例子,Netflix公司是做網絡視頻、租賃、分享的網站,他們擁有視頻的大數據,用戶什么時候暫停,什么時候截圖等等,他擁有這個視頻的大數據。通過這個大數據,他們發現了三個點,很有意思。他們這些用戶可能都喜歡其中一個演員,喜歡其中一個導演,而且還非常喜歡1990年英國的一個同名電視劇。通過這三個,他們決定最后拍《紙牌屋》,然后就一舉成功,這也是大數據當中應用非常著名的例子。本來這個行為是非常海量的、不規則的數據,他有了這個數據以后,決定了他最后拍攝《紙牌屋》成功。這是跟大家分享的一點,大數據有什么不重要,怎么用才重要。再舉個例子,今年的歐冠決賽,我是一個老球迷。歐冠上我經常去買一買,不僅是買勝負,還買比分,我還買誰進球。比如這次雙方隊員誰進球的賠率大誰的賠率最低,你絕對想不到,馬競這個隊里排名最低的是戈金,結果也驗證了,第一個球就是他進的。通過大數據的梳理,這支球隊因為他是靠防守反擊為主的,所以定位球是他們主要的進攻方式,這個時候定位球是中后衛,不通過大數據很多是沒法想到的,一般都是前鋒這樣的。所以數據本來就在那里,你用和不用都在那里,所以怎么用非常重要。
第二:大數據一旦大了以后,這個容錯性非常重要。
我再來舉一個我個人尷尬的例子,有一次我演講的時候做了一個PPT,就是關于互聯網消費心理學的一個研究。我舉了女明星的例子,她可能有線下的出場費,但是和線上不一定相對應。我當然為了好玩一點,我舉了一個例子,在淘寶網上賣這些女明星的充氣娃娃,就是宅男們喜歡的用品。不管是哪個女明星,制造充氣娃娃的時候,這個成本是一樣的,但是為什么賣的價格千差萬別,我搜了好幾個女明星,范冰冰、林志玲等,價格高的和低的差距非常大,就說明她們的受歡迎程度。我做完這個PPT之后一個禮拜,淘寶天天搞各種成人用品、情趣用品,確實很尷尬。每次一打開,他就說你需不需要這個,需不需要那個,所以這就是大數據,這就是原創性。可能會導致很多很尷尬的結果,甚至是錯誤的結果。,這個容錯性特別重要。
第三:要得到大數據的人,還要得到大數據的心。
我們追女孩子的時候,女孩子經常說你得到我的人,你得不到我的心。我們做大數據的時候,我們不僅要得到大數據的人,還要得到大數據的心。就是說你的數據不重要,重要的是使用大數據的這個人,重要的是誰在用這些數據,這個人非常重要。相同的數據擺在那里,不同的人可能會出現非常截然相反的結果。
第四:大數據重要的還是要強調趨勢和未來。
這和我的研究領域也是相吻合的,我更多的也是研究互聯網的趨勢,大數據也是這樣。比如舉個例子,過去幾年我們的旅游景區發生了非常多的事故,九寨溝有幾萬人進去以后出不來,包括華山很多人上山下不來,人太多了。我們剛才去參觀百度旅游的數據,如果說九寨溝、華山早點用百度旅游的數據進行預測,這個黃金周可能會來多少人,你賣完這么多票就不賣了,或者是采取更多的警示措施,怎么會導致幾萬人最后只能徒步下山這樣的一種惡劣性的后果?可能還會造成人員的傷亡。
這就是我對于大數據的認識,嚴格遵守時間,后面再跟大家分享。