本文首發于微信公眾號:中歐國際工商學院。文章內容屬作者個人觀點,不代表和訊網立場。投資者據此操作,風險請自擔。
有一種“數據”一目了然,比如絕大多數女性會向往賀涵這樣的男性形象,所以,熱播劇《我的前半生》有了亦舒原著中沒有的形象。
另一種“數據”卻掩藏在現象背后,且難以找到因果關聯。比如蛋撻的銷量與颶風天氣有關,啤酒放在尿不濕旁邊會賣得更好。在這里,我們不一定非得知道為什么颶風一來蛋撻銷量就會上升,只需要知道兩者之間存在這種關聯即可。
大數據不關心為什么,只關心是什么,它從因果關系變成了相關關系。”在最近中歐Global EMBA舉辦的智能大數據講座中,中歐Global EMBA2000屆校友佘暉、極光大數據聯合創始人及總裁陳菲以及數智匠人基金創始合伙人王春輝一起為大家解密了當下的大數據時代。
“不問為什么,只看是什么”
大數據真的沒邏輯嗎?
什么會促進蛋撻的銷量?是活動或Party嗎?不,答案是颶風,颶風天氣下蛋撻總是更受歡迎。啤酒與哪類產品擺放在一起時會賣得更多?是其他酒類或是下酒菜等食品類嗎?不,答案是尿不濕,父親們在購買尿不濕的時候總是喜歡再買些啤酒。
這些事物彼此之間看似毫無關聯,甚至有點匪夷所思,但卻是世界百貨公司巨頭沃爾瑪經過大量數據分析后得出的結論。事實證明,這樣的結論并非偶然。
傳統的營銷手段需要決策者們思考事物之間的邏輯關系,一本育兒類書籍的購買者,常常會得到關于另一本育兒類書籍的推薦。而在大數據時代,一切就交由大數據來處理。蛋撻銷量與颶風之間的相關性是通過對海量數據的分析所得出的結論。
大數據簡化了決策流程,不需要看“為什么”,只需要看“是什么”。它從因果關系變成了相關關系。
大數據究竟有多“大”?
“大數據”指大小超過了現在典型的數據庫軟件和工具處理能力的數據。“大數據”到底有多“大”呢?人們過去所熟知的數據量單位可能是KB、MB、GB等,然而截至2012年,數據量已經從TB(1024GB=1TB)級別躍升至PB(1024TB=1PB)、EB(1024PB=1EB)乃至ZB(1024EB=1ZB)級別。
二線城市智能交通項目3個月所存儲的圖片可達20PB,10萬GoogleGlass用戶錄制一小時視頻就可以產生100TB的數據量,這些都是我們所稱的“大數據”。在整個行業中,數據量最大的是互聯網,中國數據量最大的公司當數BAT(中國互聯網公司三巨頭:百度、阿里巴巴和騰訊),其次為運營商和金融公司。
對于現有數據庫而言,數據處理的瓶頸就是100TB。當數據量超過100TB時,現有數據庫技術就已經沒有辦法處理了。
為什么要看重“非結構化數據”?
根據儲存形式,數據可被區分為結構化數據與非結構化數據。結構化數據用表格的形式來存放。一般情況下,企業中的財務部門、人事部門以及銀行系統等使用的都是結構化數據,它是當前處理數據的主要方式。相應地,非結構化數據指的是那些不能用表格的方式來存放的數據,例如照片、音頻、網頁等,而當前的數據庫能力還不足以處理非結構化數據。
隨著科技的發展和智能產品的普及,非結構化數據的數據量遠遠超過結構化數據,這個比例目前已經達到了20:1。對非結構化數據的處理是社會發展的必然趨勢,在原有數據庫能力不足的情況下,“大數據”及其相關的新興技術為非結構化數據處理提供了可能性。
促進大數據發展的
關鍵技術是什么?
提到大數據,一個不得不說到的技術名詞就是Hadoop。Hadoop是一個分布式系統基礎構架,簡單來說,它可以把一個應用能程式分解并進行同時計算。 Hadoop技術的出現使得數據庫對于數據的處理能力得到了大幅提升。
Visa公司處理兩年730億單交易的時間由過去的一個月縮短為13分鐘;一個國內公司分析數據的準備時間由11個小時減少為幾分鐘。
大數據是2B還是2C的業務?
在應用領域內,大數據對用戶喜好的分析及相應推送可能會讓很多人誤以為大數據是2C的,但這只是整個大數據產業其中的一部分,而為整個數據產業買單的,最終還是企業。從本質上看,大數據是一個2B的業務。
大數據也更多地遵從2B行業的特性。首先,大數據的交易多發生于幾個公司之間,而不是面向個人。其次,大數據作為一項商業活動,排除了2C業務中的非理性成分。更重要的一點是,大數據還有一個特征,就是它所涉及的維度很多,數據量“大”僅僅是大數據的一個方面,而一個能夠看到公司現實狀態的“活”數據才能真正促進交易,產生價值,并用它來提高運營效率,給公司競爭力升級,這才是大數據的真實意義。
大數據的應用領域有哪些?
沃爾瑪的“蛋撻與颶風”營銷手段只是大數據應用其中一個小小的案例。在前期,大數據服務可以幫助企業進行客戶調查,從而對競爭對手做出分析,并完善本公司業務的運營方案。
而對于用戶的精準分析,可以更好地為企業的業務招攬用戶,提高投資回報率,同時也能在運營階段提高企業與用戶的連接度,讓用戶更加活躍和依賴企業相應的服務。
對于企業本身而言,大數據也可以通過對各方面數據的分析進行風險管理,以確保企業在行業內良好形象的樹立與更好的運營。
大數據行業如何走向成熟?
當海量的數據能被一一分析、存儲,而不是抽樣時,許多過去的難題會迎刃而解,基于大數據的預測會比人們的經驗、邏輯判斷更精準,甚至于醫生、律師這些行業,也會因為大數據對海量案例的分析處理能力而在未來的某一天被替代。
大數據目前正處于一個爆發式、井噴式發展的狀態。大數據促進了大量創新應用的發展,這些應用的出現在短時間內就會在行業內被復制。資本市場的追捧也是大數據發展爆發式發展的重要因素之一。
有預測指出,未來五年全球大數據的市場價值將會高達500億美元。
從行業角度來看,繼云計算等技術之后,大數據作為一項全新的技術已經成為下一個熱點,這意味著過去的技術人員已經不能夠滿足當前的市場需求,人才稀缺是大數據市場的一大特點,也給了年輕人良好的創業及就業機會。
另一方面,伴隨著中國經濟的放緩和企業的日益成熟,未來的十年將是中國數據產業從萌芽走向繁榮的十年。中國數據產業的發展將經歷一個“自下而上”的過程,各行業間先形成自己的基礎,再慢慢形成市場。中國目前還處于一個數據收集的階段,但收集完數據后讓企業接受和應用還需要一定的時間和過程。
由少數幾家企業整合市場數據是第一步,其次是對數據的深度加工并提供相應服務,當傳統企業也開始建立起數據能力時,數據產業將會趨于成熟。
大數據投資人愿意投資
什么樣的團隊?
大數據投資人最看重的是創業團隊中的“人”,這也是所有投資人考慮的第一點。行業經驗、運營數據的“基因”,作為領頭人的行業能力和“匠人”精神,甚至是個人品質,都是非常關鍵的。其次還要看這個創業團隊的目標市場是不是足夠大,即使一個團隊能在行業中做到最優,但規模卻只有幾億美元,這是不能得到投資人青睞的。此外,因為美國在大數據領域處于領先地位,有沒有美國的對標企業也是考慮的因素之一。
從商業模式來考慮,真實、獨特的數據源、他人難以進入的產業壁壘、盈利和變現能力才會讓一個團隊的業務具有生命力。當然這其中還要有技術方面的考量,行業技術的能力必不可少。
文章來源:微信公眾號中歐國際工商學院