如果有一天,你有機會去應徵全球電商龍頭阿里巴巴集團副總裁的助理,這位每天掌管阿里巴巴上千億營業額的主管給你出了道題目:
你一個禮拜過后再來面試,但在這一禮拜內,你有兩個選擇:一個是當我不在家時,你可以在我家待半小時隨便看。另一個是,你這個禮拜有半小時可以跟我吃飯,你可以問我很多問題,你要選哪一個?然后下禮拜我們再面試,看你對我的了解有多少?
問這個問題的是阿里巴巴數據委員會會長車品覺,同時也是阿里巴巴集團副總裁,歷任eBay和阿里巴巴,擁有數十年的大數據經驗,每天與阿里巴巴成千上萬的數據為伍,無論是年年創下驚人銷售額的雙十一購物潮還是馬云日前說砸了十億人民幣打擊假貨,這些都與大數據脫離不了關系,身為全球最大的電商平臺,恐怕沒有一家公司比阿里巴巴更有資格討論怎么用大數據,而在阿里巴巴集團內,車品覺堪稱大數據的第一把交椅。
回到面試,當你今天面對著這個全中國首屈一指的大數據專家,你要怎么透過數據去剖析這個人?家,是一個人最毫無防備的地方,透過觀察家中擺設可以獲取許多有價值的個人資訊,但當面問問題,可以從本人口中獲取情報,了解對方,到底哪一種數據蒐集策略才是正確的呢?
車品覺笑說:「觀察一個人的行為只能回答一部分的問題,如果不面對面討論的話,很多問題的答案是你怎么蒐集都蒐集不來的,這就是用數據拿數據(data gets data)?!管嚻酚X一語道破大數據的迷思,他認為,現在很多企業都陷入了數據迷思,為了數據而數據,卻忽略了更快更精確的方法,就好像去觀察一個人的家想要了解這個人,卻忘了其實直接問本人更快,「所以如果你今天很擔心大數據的問題,你不如去擔心將來有很多人會為了數據而數據,多愚蠢啊,舍近而求遠?!?br />
用面試說明現在許多企業陷入的數據迷思,俯拾即是生動的例子,將生硬難懂的大數據說得動聽、說得生活化,這就是在大數據中打滾數十年,自稱「每天在玩數據活兒」的阿里巴巴副總裁車品覺的魅力。
車品覺日前來臺宣傳新書《大數據的關鍵思考》,在接受《數位時代》專訪時,他分享了三個常見的大數據迷思和八個大數據實戰密技,具體而微地解說現在企業在透過大數據變現的過程中,遇到了什么樣的問題以及該如何解決,以下為專訪內容摘要:
三個大數據迷思
1.忘掉大數據吧!如果大數據已經成為大家用數據的常態了,你何必特別講他出來呢?98年的時候互聯網是一個流行語,現在還有人會說他是流行語嗎?現在有很多電子商務公司叫做傳統電子商務啊,多悲哀啊,有人還以為電子商務是新東西的時候,已經有所謂的傳統互聯網公司。
2.數據也只是創新決策其中一部分,他只不過是新工具,也不用把他想得這么萬能這么神。不是所有的問題都是數據問題,也不是所有的問題都是大數據問題,你就把他想成單純的工具使用,該用刀就用刀,該用槍就用槍,有些地方會比較適合使用數據,不用太神化他,太多的行外人把他講得很神,反而我們業內人不敢說得太神話,因為知道兌現不了。
3.不要為數據而數據。以前我們做一B2B的網站,客單價不停地掉,我們用很多數據方法去解決問題,但都沒有起色,有一天早上我覺得不對,我說我們不要看數據了,我跟工程師說,你在顧客進網站時問他:「你是幫自己買東西嗎?」結果有50%以上的人說對,你知道我花了半年的時間去尋找答案,這根本就是為了數據而數據啊,所以如果你今天很擔心大數據的問題,你不如去擔心將來有很多人會為了數據而數據
八個大數據實戰密技
1.不要說大數據,就說我們使用數據的時候到底我們知不知道這個背后數據的數據是什么?如果我的判斷是對的,你要用什么數據去證明我是對的?比如說今天氣象局說今天的溫度是12度,那我問說,過去來講這個環境中,他預測12度的正確的概率是多少?錯的概率是多少?這就是數據的數據,我要用一個數據之前,我一定會問,這個數據可不可信啊,可靠性是如何,沒有對數據的可靠性,你就先使用,你是盲目地使用,所以數據的數據是一個層面,決定可不可靠。
2.中小企業先用數據量化自己,再來談大數據。如何用好數據來量化自己?用數據理解自己,量化自己,我覺得在這個基礎上去思考我們有什么東西是可以用大數據的?這樣會更有效。小企業應該去嘗試用數據量化決策,而不是大數據,沒大這件事,就是用數據做決策,其實公司本身內部有的數據問題很多的,像是大部分公司客服數據從來沒跟公司主要數據連上,因為很多公司的客服中心都在外部,所以這個數據他拿不到,他不知道消費者的反應,這個數據又無法跟你的經營數據做關聯,所以整個數據在一個中小企業里面也是四分五裂的嘛,你在這個地方沒用好的情況下,你居然說你想用大數據,其實是有點難以理解。
3.數據案例很多會失敗都是因為蒐集數據歸蒐集,但蒐集起來之后這跟塬本的數據決策是沒有辦法合在一起的。這不僅線下會發生問題,線上也有這個問題,你可以問問現在管理首頁的人,他管理首頁有多少是根據數據去設計的,你不如問他們如果他們改版首頁,他們如何評估這個改版后的首頁是成功的?用什么數據去決定?
4.數據的刷新頻率是什么?這個值非常關鍵。刷新得快不一定比慢好,有些地方要刷得慢一點。有些東西太敏感了,你刷新的數據不一定正確,比如你要買一個二十年的保險,就是很長遠的東西,或者你要做重大投資,在這個時候你應該去看歷史的穩定數據,如果今天你剛從電影院看完一部戲,你剛看完想吃麻辣火鍋,這秒鐘,你不需要猜他的歷史性格,你應該去猜他下個場景會是什么,這個時候地點的數據非常關鍵。
5.真正的數據創新還沒出現,現在大部分的企業沒法串起數據、算法和應用創新,沒有人既懂商業又懂數據,要抓到這種機會點的人極少,我算是,但是我只是電商和零售領域的專家而已。
6.數據的創新來自兩點:一、把不該再分裂的數據分裂;二、把兩個不該拼合的數據拼合。這會產生很大的力量,例如性別不是男就是女,這兩個東西應該再也不能分裂了,但在數據上我們可以說這個人的態度有三成很女生,有七成很男生,他的態度有男生的態度在里面。有些數據已經是塬子了,但你一剖開發現不是塬子,還可以再分裂,在這個時候分出來的數據的破壞力或創意是很大的,你沒想過嘛,這對推薦引擎來講太關鍵了。商業的世界很競爭,當兩個敵對公司一結盟,像是根據開車數據調整保費,就是一個數據結合的創新案例。
7.我看到的大數據項目都是失望比較多的,很多大數據項目都還在實驗室,當這些東西到企業就不行了,企業需要準確,還有很多問題是要分場景化的。
8.數據分析師要量化自己的量化,這對我們這行很重要。我們整個行業最討厭什么東西你知道嗎?你找一個人去準確算出一個東西,不難,但是六個月都準,很難,時間一長,就不準確了。時間一長,整個模型是用歷史數據建立出來的,當歷史數據變得越來越不重要的時候,這個模型就會變得沒那么準確了,這個時候你就要改進你的算法了。
原文鏈接:http://www.thebigdata.cn/YeJieDongTai/13905.html