“數(shù)據(jù),已經(jīng)滲透到當(dāng)今每一個行業(yè)和業(yè)務(wù)職能領(lǐng)域,成為重要的生產(chǎn)因素。人們對于海量數(shù)據(jù)的挖掘和運用,預(yù)示著新一波生產(chǎn)率增長和消費者盈余浪潮的到來。”大數(shù)據(jù)時代的到來,最早由全球知名咨詢公司麥肯錫提出。
的確,這是大數(shù)據(jù)的時代。在紐約市曼哈頓區(qū)南部的華爾街,投行根據(jù)民眾情緒拋售股票;對沖基金依據(jù)購物網(wǎng)站的顧客評論,分析企業(yè)產(chǎn)品銷售狀況;就在剛結(jié)束不久的巴西世界杯上,谷歌的云計算平臺通過對大量球隊數(shù)據(jù)的分析,成功預(yù)測了世界杯16強(qiáng)比賽每場比賽的勝利者。
大數(shù)據(jù)是繼云計算、物聯(lián)網(wǎng)之后,IT行業(yè)又一大顛覆性的技術(shù)革命,當(dāng)云計算為數(shù)據(jù)資產(chǎn)提供保管、訪問的場所和渠道時,數(shù)據(jù)才是真正有價值的資產(chǎn)。無論是企業(yè)內(nèi)部的交易信息,還是互聯(lián)網(wǎng)世界中的商品物流信息,其數(shù)量與實時性將遠(yuǎn)遠(yuǎn)超越現(xiàn)有企業(yè)IT架構(gòu)和基礎(chǔ)設(shè)施的承載能力。
曾經(jīng)很長一段時間里,大數(shù)據(jù)只停留在概念層面,而互聯(lián)網(wǎng)、移動設(shè)備的發(fā)展則讓這個概念落地成為現(xiàn)實。大數(shù)據(jù)意味著什么?如何盤活這些數(shù)據(jù)資產(chǎn),以促進(jìn)企業(yè)業(yè)務(wù)創(chuàng)新,利潤增長?這些都是大數(shù)據(jù)的核心議題。
大數(shù)據(jù)價值
從字面理解,大數(shù)據(jù)首先要足夠“大”。
一組名為“互聯(lián)網(wǎng)上一天”的數(shù)據(jù)告訴我們,一天之中,互聯(lián)網(wǎng)產(chǎn)生的全部內(nèi)容可以刻滿1.68億張DVD;發(fā)出的郵件有2940億封之多(相當(dāng)于美國兩年的紙質(zhì)信件數(shù)量);賣出的手機(jī)為37.8萬臺,高于全球每天出生的嬰兒數(shù)量37.1萬……截至2012年,大數(shù)據(jù)的量級飛速增長,數(shù)據(jù)量從TB(1024GB=1TB)級別躍升到PB(1024TB=1PB)、EB(1024PB=1EB)甚至ZB(1024EB=1ZB)級別。IBM的研究稱,整個人類文明所獲得的全部數(shù)據(jù)中,有90%是過去兩年內(nèi)產(chǎn)生的。到2020年,全世界所產(chǎn)生的數(shù)據(jù)規(guī)模將達(dá)到今天的44倍。難怪亞馬遜前任首席科學(xué)家Andreas Weigend說,“數(shù)據(jù)是新的石油。”
1號店董事長于剛在接受媒體采訪時表示,大數(shù)據(jù)的價值體現(xiàn)分四個階段。一開始數(shù)據(jù)是原始和零散的,表面看不出規(guī)律,經(jīng)過過濾和組織后成為信息;再將相關(guān)聯(lián)的信息整合和有效呈現(xiàn)后轉(zhuǎn)化為知識,把對知識的深層領(lǐng)悟升華到理解事物的本質(zhì),并可以舉一反三成為智慧。所以數(shù)據(jù)是源頭,是決策和價值創(chuàng)造的基石。
而對于不同行業(yè),大數(shù)據(jù)有著其特有的意義與價值。
在互聯(lián)網(wǎng)行業(yè),大數(shù)據(jù)指的是這樣一種現(xiàn)象:互聯(lián)網(wǎng)公司在日常運營中生成、累積的用戶網(wǎng)絡(luò)行為數(shù)據(jù)。以百度、阿里巴巴、騰訊等巨頭為代表的平臺型企業(yè)匯集了海量用戶和商家,聚集成富有張力的生態(tài)系統(tǒng)。它們的大數(shù)據(jù)應(yīng)用不再僅僅局限于企業(yè)本身,而是逐漸成為滋養(yǎng)整個大生態(tài)系統(tǒng)的血液。
阿里巴巴數(shù)據(jù)委員會主席車品覺曾一語道破阿里巴巴的大數(shù)據(jù)策略。“在數(shù)據(jù)化運營階段時,數(shù)據(jù)就產(chǎn)生價值,你有意識地用它,但卻沒有關(guān)注它。而當(dāng)你發(fā)現(xiàn)數(shù)據(jù)已經(jīng)和戰(zhàn)略融合后,你認(rèn)識到要有意識收集它,管理它。”如果將阿里巴巴的大數(shù)據(jù)比做食材,那么自己用原料做菜,和將食材提供給其他廚師相比,二者對原料的關(guān)注度完全不同。
易傳媒移動運營研發(fā)中心副總裁高照在接受《中國產(chǎn)經(jīng)新聞》記者采訪時表示,對于互聯(lián)網(wǎng)企業(yè)來說,大數(shù)據(jù)意味著“能帶來立刻購買與回報的數(shù)據(jù)”,即立刻能促進(jìn)用戶購買的數(shù)據(jù)。
“毫無疑問,互聯(lián)網(wǎng)企業(yè)對于數(shù)據(jù)非常重視,只不過他們在大數(shù)據(jù)的層次上稍有不同。這些企業(yè)接近最終消費達(dá)成的一端,他們本身就是數(shù)據(jù)制造者,擁有海量的用戶消費數(shù)據(jù)。同時他們擁有處理數(shù)據(jù),以及挖掘數(shù)據(jù)的能力。”高照說道。
硬幣的一面是互聯(lián)網(wǎng)企業(yè)對于大數(shù)據(jù)的嫻熟運用,另一面則是傳統(tǒng)行業(yè)在大數(shù)據(jù)的語境下被互聯(lián)網(wǎng)企業(yè)徹底顛覆。
傳統(tǒng)意義上,金融系統(tǒng)都是基于數(shù)據(jù)庫的,很多金融業(yè)務(wù)系統(tǒng)已經(jīng)構(gòu)建,如BI、信息分析。然而根據(jù)科斯定理,基于大數(shù)據(jù)的直接金融交易或會令金融機(jī)構(gòu)的中介價值消失。假設(shè)在互聯(lián)網(wǎng)支持金融市場完全互聯(lián)網(wǎng)化,完全是供求方和需求方直接交易的情況下,交易成本會減少很多。
有專家認(rèn)為,大數(shù)據(jù)可以提高金融機(jī)構(gòu)的運營效率,降低成本。如果將網(wǎng)上銀行、網(wǎng)上保險這些非結(jié)構(gòu)性數(shù)據(jù)都備植到大數(shù)據(jù)平臺上,則可以在歷史數(shù)據(jù)和新數(shù)據(jù)增量的背景下,為金融機(jī)構(gòu)提供全面的數(shù)據(jù)分析與整合。
《互聯(lián)網(wǎng)金融》雜志副總編、中央民族大學(xué)法學(xué)院教授鄧建鵬對《中國產(chǎn)經(jīng)新聞》記者表示,對于金融機(jī)構(gòu)來說,大數(shù)據(jù)的重要性不言而喻。能否很好地運用企業(yè)和客戶數(shù)據(jù),對金融機(jī)構(gòu)挖掘優(yōu)質(zhì)借款人,以及識別風(fēng)險都起著重要作用。
大數(shù)據(jù)轉(zhuǎn)化
在《大數(shù)據(jù)時代》一書中提到,未來,數(shù)據(jù)將會像土地、石油和資本一樣,成為經(jīng)濟(jì)運行中的根本性資源。數(shù)據(jù)科學(xué)家被認(rèn)為是下一個十年最熱門的職業(yè)。
事實上,當(dāng)你仍然在把微博等社交平臺當(dāng)作抒情或者發(fā)表議論的工具時,華爾街的斂財高手們卻正在挖掘這些互聯(lián)網(wǎng)的“數(shù)據(jù)財富”,先人一步用其預(yù)判市場走勢,以此取得了不俗的收益。數(shù)以PB計的數(shù)據(jù)因得到了有效轉(zhuǎn)化與利用,重新煥發(fā)了其價值。
擁有龐大數(shù)據(jù)生態(tài)的阿里巴巴,已經(jīng)攢下了超過100PB已處理過的數(shù)據(jù),等于104857600GB,相當(dāng)于4萬個西雅圖中央圖書館,580億本藏書。對于阿里金融來說,數(shù)據(jù)庫就是其核心資產(chǎn)。
基于采集到的海量企業(yè)數(shù)據(jù),阿里前期會搜集包括商家平臺認(rèn)證和注冊信息、歷史交易記錄、信用記錄等結(jié)構(gòu)化數(shù)據(jù),以及用戶評論等非結(jié)構(gòu)化數(shù)據(jù),同時還引入外部搜集的用電量、銀行信貸等數(shù)據(jù),做出放貸與否、放貸額度的精準(zhǔn)決策。
對于淘寶賣家,阿里會綜合其每月的交易額、發(fā)貨地址、手機(jī)號段、家庭住址、性別等數(shù)據(jù),以作為信用評價的維度之一。通過對賣家進(jìn)行定量分析,借助“淘數(shù)據(jù)”,“數(shù)據(jù)魔方”,“聚石塔”等數(shù)據(jù)產(chǎn)品,阿里巴巴精準(zhǔn)轉(zhuǎn)化與利用了平臺上的海量數(shù)據(jù)。
高照認(rèn)為,企業(yè)對于大數(shù)據(jù)的利用,本質(zhì)上都是通過數(shù)據(jù)幫助品牌建立起對消費者的精準(zhǔn)洞察。企業(yè)可以通過原有數(shù)據(jù)獲得更多新數(shù)據(jù),以此提升產(chǎn)品性能,實現(xiàn)產(chǎn)品更新?lián)Q代。
與此同時,大數(shù)據(jù)的轉(zhuǎn)化過程也是大數(shù)據(jù)生態(tài)的構(gòu)建過程。這個生態(tài)包括數(shù)據(jù)生產(chǎn)者、數(shù)據(jù)記錄者、數(shù)據(jù)處理分析者、甚至數(shù)據(jù)使用者。
“大數(shù)據(jù)生態(tài)的上下游是千億量級的產(chǎn)業(yè)鏈。”高照說道。遍布于城市各個角落的智慧照明系統(tǒng),可以成為城市大數(shù)據(jù)的一個采集器,就如同智能手環(huán)可以給用戶提供確實性的健康數(shù)據(jù)。
海量數(shù)據(jù)在創(chuàng)造互聯(lián)網(wǎng)生態(tài)的同時,也令互聯(lián)網(wǎng)與金融的邊界越來越模糊,由數(shù)據(jù)挖掘產(chǎn)生的金融創(chuàng)新,正在深刻改變著傳統(tǒng)金融機(jī)構(gòu)的運作模式。作為數(shù)據(jù)密集型的行業(yè),金融業(yè)應(yīng)如何通過挖掘和分析數(shù)據(jù)來進(jìn)行決策,成為當(dāng)下一個重要的議題。
鄧建鵬表示,銀行掌握的客戶數(shù)據(jù)比較單一,還有很多數(shù)據(jù)銀行并沒有掌握,比如用戶每個月的水電煤氣費,坐火車飛機(jī)的行程單,以及上網(wǎng)購物的足跡等。因此,如果銀行能進(jìn)一步豐富數(shù)據(jù)范圍,全方位開發(fā)客戶數(shù)據(jù),對于銀行開發(fā)更多的優(yōu)質(zhì)借款人,進(jìn)一步識別風(fēng)險都有好處。
事實上,面對大數(shù)據(jù)時代的到來,銀行也已開始發(fā)力。如民生、中信、光大等多家銀行已開展供應(yīng)鏈金融服務(wù),實現(xiàn)了從“線下手工處理”到“線上多系統(tǒng)集成”的轉(zhuǎn)變。具體的做法是,在線整合與銜接各方流程,建立商務(wù)、資金服務(wù)與物流服務(wù)銜接的工作通道,讓融資在線可得;同時整合與共享銀行、核心企業(yè)與上下游企業(yè),以及物流伙伴之間割裂的分散信息,讓供應(yīng)鏈管理與服務(wù)清晰可見。
與此同時,銀行也開始涉足互聯(lián)網(wǎng)平臺,如建設(shè)銀行的善融商務(wù),工商銀行的電商平臺,都意在大數(shù)據(jù)。
和互聯(lián)網(wǎng)企業(yè)一樣,傳統(tǒng)金融機(jī)構(gòu)最后也會形成獨特的大數(shù)據(jù)生態(tài)。鄧建鵬表示,傳統(tǒng)金融機(jī)構(gòu)本身擁有數(shù)據(jù),如果完全依靠自身的系統(tǒng)去挖掘與轉(zhuǎn)化數(shù)據(jù),成本非常高。因此,和互聯(lián)網(wǎng)巨頭合作是很好的方式。銀行可以利用互聯(lián)網(wǎng)企業(yè)的數(shù)據(jù),開展各項服務(wù),最終達(dá)成共贏的生態(tài)圈。
“重視”大數(shù)據(jù)
數(shù)據(jù)采集得越多,變量越多,由此帶來的數(shù)據(jù)“噪音”也越多。在大數(shù)據(jù)的海洋中,有相當(dāng)一部分是無用的數(shù)據(jù)。有些數(shù)據(jù)對企業(yè)暫時沒有用,有些則永遠(yuǎn)沒用。大數(shù)據(jù)本身良莠不齊,如何才能更好地判別數(shù)據(jù)價值?
eBay大中華區(qū)CEO林奕彰認(rèn)為,那些現(xiàn)在看起來無效的數(shù)據(jù),明后年可能就會隨著科技進(jìn)步被消化,目前只能先把這些數(shù)據(jù)儲存起來。
大數(shù)據(jù)廠商Teradata天睿公司CTO寶立明表示,不能一昧否定看似無用的數(shù)據(jù),它們同樣蘊含著價值,它們確切的說法應(yīng)該是低價值密度數(shù)據(jù)。企業(yè)只是尚未找到其價值體現(xiàn)手段,因此可以用低成本的存儲服務(wù)器加以保留。例如,當(dāng)人們通過搜索引擎檢索時,會出現(xiàn)一些習(xí)慣性的拼寫錯誤。這些錯誤數(shù)據(jù)雖然表面上沒有意義,但通過收集這些數(shù)據(jù)卻可以發(fā)現(xiàn)大量的用戶習(xí)慣和規(guī)律。
“并沒有一個通用的大數(shù)據(jù)法則。每個企業(yè)都需要根據(jù)自身情況去制定自己的菜譜,從而幫助自己更好地消化這些數(shù)據(jù)。”高照說道。
高照表示,每個企業(yè)需要的數(shù)據(jù)都不一樣。比如,車企需要的數(shù)據(jù)體量比較小,但單個數(shù)據(jù)的價值很高,并且這些數(shù)據(jù)在一段時間內(nèi)還會進(jìn)一步發(fā)揮價值。相比之下,快銷品的用戶傾向于持續(xù)購買,因此快銷行業(yè)的大數(shù)據(jù)系統(tǒng)都在百萬千萬級別。所以,行業(yè)不同,對數(shù)據(jù)挖掘的周期、維度也不同。
有專家指出,雖然數(shù)據(jù)是真實的,但是它會有偏向性,不同的分析方式,會有不同的解讀,所以它可能并不完全客觀。要審慎地用正確的方法處理數(shù)據(jù),才能獲得正確的信息。
如果說無用數(shù)據(jù)會帶來數(shù)據(jù)噪音,那么安全問題就是懸在大數(shù)據(jù)頭上的“達(dá)摩克利斯之劍”。
基于大數(shù)據(jù)可以對人們的狀態(tài)和行為進(jìn)行預(yù)測,未被妥善處理的大數(shù)據(jù)會對用戶隱私造成極大侵害。社交網(wǎng)絡(luò)研究表明,通過群組特性可以發(fā)現(xiàn)用戶屬性。例如通過分析用戶的Twitter信息,可以發(fā)現(xiàn)用戶的消費習(xí)慣以及喜好的球隊等。
有專家表示,應(yīng)該對用戶隱私提供一定的保護(hù),例如通過數(shù)據(jù)加密,只讓需要知道數(shù)據(jù)的人了解、接觸或者訪問到這些數(shù)據(jù)。
隱私侵入問題不僅存在于個人用戶,也存在于企業(yè)。從心臟出血漏洞、攜程拖庫等事件可以看出,黑客利用大數(shù)據(jù)分析向企業(yè)發(fā)起的攻擊更為精準(zhǔn)。對此高照表示,在大數(shù)據(jù)層面,企業(yè)最重要的是建立自有數(shù)據(jù)平臺。在該平臺,只有內(nèi)部人在一定權(quán)限許可下才可以訪問和使用。
有專家表示,可靠的數(shù)據(jù)存儲、安全的挖掘分析、嚴(yán)格的運營監(jiān)管是大數(shù)據(jù)時代企業(yè)安全的剛需,安全產(chǎn)業(yè)鏈協(xié)同成為必然趨勢。信息安全需要在政府主管部門的統(tǒng)一協(xié)調(diào)管控之下,由產(chǎn)業(yè)鏈各個環(huán)節(jié)的企業(yè)開放安全數(shù)據(jù)和技術(shù)能力。
“大數(shù)據(jù)安全是一個永恒的話題,重要的是通過技術(shù)手段,降低安全風(fēng)險。”鄧建鵬說道。
現(xiàn)在,大數(shù)據(jù)帶來的信息風(fēng)暴正在變革我們的生活、工作和思維,開啟了一次重大的時代轉(zhuǎn)型。被譽(yù)為“大數(shù)據(jù)商業(yè)應(yīng)用第一人”的維克托·邁爾·舍恩伯格指出,大數(shù)據(jù)時代最大的轉(zhuǎn)變就是放棄對因果關(guān)系的渴求,而取而代之關(guān)注相關(guān)關(guān)系。
的確,大數(shù)據(jù)已為我們的生活創(chuàng)造出了前所未有的可量化的維度,大數(shù)據(jù)已經(jīng)成為了新發(fā)明和新服務(wù)的源泉,而更多的改變正蓄勢待發(fā)。