數據大規模流通與交易將會盛行,很大程度上已成為了業界對大數據未來應用模式的一個共識。
連在《中共中央關于制定國民經濟和社會發展第十三個五年規劃的建議》和國務院印發《促進大數據發展行動綱要》中,都作出了關于推進數據資源開放共享的戰略規劃,要求各級政府引導培育大數據交易市場,開展面向應用的數據交易試點,探索開展大數據衍生產品交易,鼓勵產業鏈各環節的市場主體進行數據交換和交易,促進數據資源流通,建立健全數據資源交易機制,規范交易行為等一系列健全市場發展機制的思路與舉措。
雖然上有政策、下有產業展望,更有眾多先行者已經投入參與到數據交易的試驗田之中,但數據流通的模式究竟是怎樣,恐怕目前還是一個懵懂的話題。
1、數據流通河流的形成
熟知地理的朋友都會清楚,河流的形成,首先源于高原或是高山上有冰川存在,冰川會隨季節溫度的變化而變化,溫度上升,冰川消融形成若干條小溪,小溪隨地勢變化匯集到谷地,在谷底形成小河,若干小河又隨地勢慢慢匯集成大河,大河從山區奔涌出來得到沿途支流和降水的補給流淌進入海洋,同時河流沖刷掉河流底部的物質并帶走,使得河床向下切割,最終形成穩定的河床。
未來的數據流通,宛如上述的河流形成過程,要勾畫出一張完整的宏觀大數據流通版圖,需要首先深入理解數據的形成來源。
對于大數據的理解,很多剛接觸的人簡單理解為Hadoop+4V特征,存在海量異質異構的數據,需要新技術去應對,從而抽取出內涵的價值。誠然這個認識是說得通的,但卻偏重于從科技角度去看待大數據,比如4V特征是IT廠家提出的,無論哪一個V,最終都演變為IT預算的提升,就正如當年淘金熱,最后發財的是在河流旁邊賣水和工具給淘金者的人。
而正因數據未來的潛在高流動性,我認為需要于從大數據的數據形成來源去深入理解。
數據的本質,是各類信息的數字化編碼,數字化使得信息采集、存儲、處理及分發的速度得到了不可思議的飛躍,也帶領人類進入了信息爆炸的時代。而信息歸根到底是以人為主體的、與客觀世界各種其他客體之間交互的狀態和變化的反映,也是人與其他事物之間相互連接和相互作用的表征。因此從這個角度理解,數據是以人與“其他事物”之間數字化連接下的信息副產物。
互聯網逐漸賦予了我們與這些“其他事物”間無處不在的數字化連接,最早Web 1.0實現了人與信息的連接,門戶網站、搜索引擎讓我們沖浪于信息的海洋;SNS、IM分別以異步/同步的形式實現了人與人在互聯網上前所未見的緊密連接;而傳感器與物聯網技術的興起,讓我們與物品也建立了數字化連接,與家中的空調、冰箱聊天不再天方夜譚;而O2O則開啟了傳統服務業的互聯網化;最后則是產業互聯網,過往傳統產業無法知道自己的終端用戶究竟是誰,而產業互聯網將深度將產業與終端用戶實現綁定連接。
而上述數字化連接的背后,將產生難以估量的數據,如人與人間的連接產生了海量的UGC數據,基于Twitter數據的股市情緒分析、輿情監測等應用都留下了有趣的想象空間,智能穿戴設備每天產生了大量的健康數據,正是基于互聯網的數字化連接的出現,成為了大數據的繁衍溫床。而隨著將有更多事物與我們產生數字化連接,如大量的產業、更多的智能設備、車聯網等,人類數據總量還會經歷更為壯觀的擴容。
2、數據流通宏觀版圖
大數據成于互聯網的不斷外延,數字化連接的必然結果就是孕育了海量的數據。在過去弱連接時代,運營商、銀行等服務機構雖然探測用戶行為的能力,但不同于交易數據,這些數量龐大、處理復雜的用戶行為數據屬于不需要強制記錄的數據,而Hadoop等大數據技術,賦予了業界低成本的大規模數據存儲及計算的工具,使得在這些數字化連接中有更多的數據得以沉淀,漸漸將匯聚為數據海洋,而這些數據又能反饋到數字化連接中,構建出一個有趣的全新版圖。
▋物聯網平原——越來越廉價的傳感器讓萬物皆互聯、智能感知變成了可能,智能化設備外延的擴大是更為清晰的趨勢。在我們生活當中,將會有更多的傳感器出現在不同物品之中,無論是智能跑鞋、可穿戴設備、智能家居設備、智能家電等,傳感器及物聯網一方面為它們帶來了緊密的數字化連接,不同設備間能實現同步的通信,而為更為重要的是,這些傳感器將會把我們一切的使用習慣與偏好、個人特征、潛在需求等都量化為數據,匯聚到大數據海洋之中,在未來,物聯網將會成為大數據最重要的來源,就如一塊廣闊無邊的平原一樣,一旦進入,則一馬平川。
如此前李寧連同小米推出了一款內嵌了傳感芯片的智能跑鞋,我們先跳出其銷量和客戶評價高低,這款智能跑鞋概念上能收集到步數、距離、路線、步頻、卡路里等跑步準常規數據,更能監測用戶跑步時腳掌的落地方式和跑鞋緩解沖擊比例等用戶跑姿與跑鞋性能數據,并將數據上傳到云端,同步為用戶反饋回跑步統計數據及相關建議,以幫助用戶提高運動水平,減輕運動勞損。而將來甚至能應用這些數據,提供健康計劃,保險計劃、跑鞋定制等服務,使得跑鞋本身已經脫離了傳統的產品范疇。
▋服務互聯網山谷——O2O開啟了線下傳統服務業與用戶數字化連接的浪潮,而更為傳統的電信運營商早已意識到在對用戶讓渡價值的過程中,能收集到海量的數據,形成運營商大數據之源,并依據數據提供個性化服務與推薦,形成反饋閉環。隨著服務業——產業——用戶三方連接的強化,服務互聯網的藍圖將清晰呈現。
▋產業互聯網山脈——說山脈是有原因的,產業互聯網是一座此前甚少人能涉足的山區,在過去,對于大部分產業而言,核心在于大規模、低成本的生產。但目前產能將逐漸不再是產業瓶頸,智能生產、3D打印技術將帶領我們進入個性化生產與服務的時代,互聯網技術將對產業產生顯著甚至決定性影響,成為產業的核心競爭力所在,產業互聯網具體有幾個趨勢:
‖趨勢一:產業-產品-用戶建立反饋經濟閉環連接。
在過去傳統產業無法了解到終端用戶是誰,更無從分析用戶的產品使用行為,而物聯網和傳感器帶來的智能化浪潮,讓產品成為了產業與用戶間的中樞,不斷將數據輸出到產業端,賦予產業快速反饋用戶新需求的能力,而這個閉環代表了反饋經濟在消費端的主要形態。
‖趨勢二:產業與服務的界限逐漸模糊,客戶運營商將產生。
反饋經濟的興起,顛覆了過往產業與用戶的關系,從過去單純的生產-銷售關系轉變為生產-銷售-服務的關系,產業與服務間將越行越近,提供產品,相當于提供一個可持續運營客戶的平臺,小米的成功,歸根到底就是從單純的生產手機,跳躍到以小米手機為平臺運營一個龐大的客戶生態圈,任何客戶的需求在這個生態圈中都可以得到快速反饋,社交平臺、去中心化的方式讓用戶成為小米的核心工程師。
‖趨勢三:智能工廠的產生。
產業與產品的從屬關系將由計劃經濟走入以用戶個性化需求為根基的智能生產,產業再也無法強塞給客戶各種標準化的產品,而是根據客戶的特征提供個性化的產品,而智能工廠則是為此而生。
▋社會化媒體高原——人與人之間的連接是傳統互聯網的根基之一,社交媒體為人類的經濟與政治帶來了深遠的影響,而當幾乎人人都有一個Twitter賬號之后,社會化媒體將會發生怎樣的演變?或許最大的趨勢在于社會化媒體的主體化,圍繞圖片分享、職場關系催生了Instagram以及LinkedIn兩個估值無限的SNS新模式,而圍繞上述客戶運營商的趨勢,將來是否會圍繞產品/興趣產生更多的主體化社會媒體?我們拭目以待。
▋傳統互聯網極地——搜索引擎、門戶網站等傳統互聯網應用的影響力將逐漸受到沖擊,而人與信息的連接,未來核心趨勢也許在于Siri式的人工智能大數據引擎。Siri、Cortana滿足普通大眾對于信息的智能化搜尋,而更多基于專業領域大數據的人工智能系統將逐漸出現,如IBM基于Watson的醫療大數據人工智能系統,她能“聽懂”醫生的自然語言問題,同時快速分析堆積如山的醫療研究數據給出答案。趨勢的本質,在于人類知識圖譜的智能化,知識的爆炸將超越人類物理學習的能力范疇,如何讓人類擁有一個“數字化外腦”,幫助人類個體連接到個體學習永遠不可想象的龐大知識數據,是知識圖譜智能化的核心任務。
3、未來:數據流通的專業化分工
各個疆域數字化連接所產生的數據,匯聚為一條條河流,最終匯入無際的大數據海洋(Ocean of Bigdata),而來自五湖四海的數據需要重新回到大陸上,屆時,數據將出現三個“長尾”特征,即數據的供給是長尾的,數據的需求也是長尾的,而數據本身同樣是長尾。因此,數據大規模的流通和交易將成為大數據的一個核心業態,一方面數據不再被少量巨頭所壟斷,另一方面各行各業都需要數據作為反饋經濟的生產資源,一個社會化的數據交易平臺與通道的出現,將會是最為經濟的選擇。
因此,從這個角度理解,大數據的流通和交易,是徹頭徹尾的流通業務場景問題,在不同的區域板塊中,數據流通會有顯著不一樣的模式,各個領域甚至都有自己的數據流通標準,因此我預測會一種創新性的區域產業行數據交換組織將會誕生,那就是產業數據交換聯盟(Industrial Data-Exchange Alliance)。產業數據交換聯盟是一種圍繞特定產業的企業成員制組織,如交通大數據交換聯盟、金融大數據交換聯盟等,其服務于成員間的數據交易,并致力于打造低成本、規范化的數據流通平臺。對內產業數據交換聯盟指定嚴格的成員行為準則,明確保護個人用戶數據隱私,并制定聯盟內部標準數據交換協議(Standard-Data Exchange Protocol),統一數據標準。
正因如此,大數據流通的產業內專業化分工,是大數據流通逐漸走向成熟的標志,一個個產業數據交換聯盟將會在自己的版圖內加速數據流通河流的形成,正如河流形成的歷史上,由于地面上水潭或湖泊太多,影響了遠古人類的生產生活,遠古人類于是有意識的疏浚這些水域,又加快了河流的形成。