大數據真正的財富蘊含在產業鏈條而非消費鏈條之中,因此,大數據與產業融合將成為落地的根本
互聯網上的每一個“你”是否意識到,在網絡瀏覽新聞、收發郵件,在電商下單購物,在社交網站與朋友互動,甚至用手機APP上傳自拍照片……你的每一個網絡“足跡”都會以“數據”形式被記錄并存儲下來,而這些以幾何數量級增長的數據正在逐步重構互聯網世界,也在重構我們的生活。
過去的一年內,大數據無疑已經成為年度最火IT詞匯。EMC、IBM、Oracle等跨國IT巨頭紛紛發布大數據戰略和產品,美國實施大數據計劃,聯合國發布大數據報告,我國不少城市和園區宣布發展大數據產業。然而爭議總是伴隨著熱點,對于大數據,反對者認為這不過是企業又一次概念的炮制和兜售、又一場跑馬圈地熱潮。
“由于數據量缺失、大數據清洗和分析能力不足以及數據可視化瓶頸等問題,幾年間大數據在國內遲遲未能落地”,在接受《中國投資》專訪時,天云大數據CEO雷濤告訴記者,目前隨著基礎設施布局的逐漸完善,大數據的發展已經走到一個新的臨界點。
當前,多媒體、社交媒體、物聯網的廣泛應用都將極大地增加企業所能獲取的信息量。加工機械內置的傳感器正在收集運營數據,營銷人員掃描社交媒體或利用智能手機的定位數據了解顧客的消費習慣,數據交換可能正在與供應鏈合作方聯網,員工則可以在企業內部網上交流最佳做法。據IDC預測,到2020年全球將總共擁有35ZB(10萬億億字節)的數據量。
在雷濤看來,雖然目前我國大數據產業還處于發展初期,市場規模仍然比較小,但國內廠商正快速跟進,整體產業生態環境正在建立之中。他告訴記者:“天云大數據就是希望在擁有大量數據資源的金融、電信、安全等行業發力,將大數據的概念落實在垂直領域內,將產業企業積累的數據價值給予體現”。
首要投資:分布式計算
此前全球著名信息技術研究和咨詢公司高德納公司曾發布報告預測,2016年,大數據對全球IT開支的直接或間接推動將達到2320億美元。賽迪顧問研究表示,2013年中國大數據IT應用市場規模達到34.3億元,未來3年大數據應用市場將呈現爆發式增長,以近90%的年均復合增長率增長,到2015年,大數據應用市場規模預計將達到144.96億元。
在雷濤看來,大數據真正的財富蘊含在產業鏈條而非消費鏈條之中。“產業互聯網的出現使得更多的數據被產生出來,各式各樣的移動設備以及產業鏈條中生產線上的傳感器所采集到的數據全都進入產業結構中,對于產業的升級和變化都是一個巨大的商機”,雷濤告訴記者,相較消費數據,生產數據所蘊含的“金礦”規模更為龐大。
每一次產業革命出現的時候,首當其沖的投資機會都出現在工具類。挖一個金礦,賣鐵鍬的先掙錢。這樣的趨勢已經在北美出現,而天云大數據則是國內較早發力在工具平臺領域,幫助別人挖金子的企業。我們與北美同步先就緒一些大規模的分布式系統,這些系統替換傳統結構里的數據庫存儲、小型機等小型架構,用大規模云計算的底層基礎設施首先幫助需要挖金子的人具備這種能力。
依靠分布式系統的架構,電信運營商由之前只能處理每個人幾千條的電話記錄,現在可以處理每人幾百萬條的上網瀏覽記錄,從中提取有價值的數據;國家電網不僅可以管理靜態物資、ERP電子資源信息,還可以管理到消費者的反饋,看出來誰在使用電,哪里在使用電,從而實現更為精確的發電、送電以及進行差異化定價。這些數據的規模都是幾萬倍的增長,靠傳統的系統架構是不現實的。因此,大數據第一類的投資機會都出現在能夠率先就緒大數據工具,將原有數據結構處理不了的信息平臺構建起來的廠商之中。
數據與業務融合
“第二類投資機會將會出現在科研領域,而這部分目前國內關注較少”,雷濤告訴記者,在北美地區,大數據廠商最為耀眼的明星集中在進行分布式計算和數據科學的廠商之中,他們關注的是怎么去更聰明地使用數據。例如應用大數據技術設施平臺對自然語言進行規?;幚?,對視覺進行處理。而這一類投資的產生與數據基礎設施的建設是密不可分的,只有構建并使用了大型的數據基礎設施,才能將這類創新投資與產業更為緊密地結合起來。
而第三波投資機會將會出現在如何將數據價值化的過程中。數據開始投身到某個垂直領域,而不再以云基礎設施的面貌出現。雷濤表示:“越來越多的大數據工具廠商開始將工具投入到具體的產業領域內,直接產生價值。這里面就催生了很多投資機會,比如在醫療、教育這些之前很難用傳統信息化結構去匯總和支撐的領域內,開始發生顛覆產業的變化。而對于那些擁有大數據資源的金融、電信行業來說,如何通過大數據的方式進行改良,進行破壞性的創新,則成為行業企業與大數據平臺類企業聯手的核心價值所在”。
為何使用大數據?
嚴格意義上的大數據運用,對于許多中國企業是不期而遇。
重慶移動現有1000多萬移動用戶,隨著移動互聯網的快速發展,手機上網用戶呈爆炸式增長。但隨之而來的是,由于現無法存儲海量的用戶上網數據,越來越多的手機用戶為每月“不透明”的手機上網話費產生了強烈質疑,客服投訴壓力日漸增大,也在很大程度上消耗著公司的資源和成本。
為解決這個問題,重慶移動擬新建“GPRS上網日志查詢系統”,解決上網話單的存儲和查詢問題。然而在數據爆炸的時代,這些數據的體量日益膨脹。根據其現有業務量,每日新增的上網數據量約1TB,初期規劃存儲60天,總共60TB的存儲量。而以手機上網日志的信息量為例,更是遠遠超過傳統話單數據量,達到每天超過1TB的級別,且在不斷增長。
“事實上除了上網行為、流量信息等老百姓看得見的方面,運營商還可通過基站上的信令數據掌握手機用戶的位置信息。假如把這些大數據全都累積在一起,運營商一個省級公司一天信息量最高甚至可達1萬TB”。采訪中雷濤向記者表示,為提高查詢效率,移動公司提出更高的計算時間和查詢次數要求,在對系統的數據安全和信息安全予以設計考慮的同時,要求盡量節省總體投資造價。
以過往運營商較多采用的IBM、微軟等傳統關系型數據庫為例,想要達到上述目的非常困難同時成本較高。雷濤告訴記者,以傳統方式存儲1TB的數據,成本在3萬-9萬元區間,而采用云計算新架構,則可將成本降低到每TB5000-1.5萬元之間。在重慶移動,天云大數據采用業界領先的Hadoop分布式文件系統技術框架,節省了總體投資的60%-70%,對運營商的吸引力顯而易見。當前運營商向擅長數據存儲、分析的公司尋求合作,積極掌握新技術已經成為行業明顯的投資趨勢。
雷濤告訴記者,與其合作的國內運營商當前大數據應用普遍還是為自身業務發展服務,側重于流量經營與精準化營銷方向。流量經營方面可分析海量用戶的流量使用情況,以便設計出更具針對性的流量套餐。精準化營銷則通過捕捉用戶的上網瀏覽信息等,將來可向用戶投放精準廣告。“至于將數據向第三方分享等商業模式,其實各方都很想做,也有過一些試驗性質探討,但隱私問題是橫亙在眼前的不確定因素”。
在雷濤看來,技術層面破壞性創新正使過去的壟斷者失去地位:“我們正與IBM、Oracle、SAP、VMware、EMC等國際IT巨頭競爭”。
基金+基地
一些嗅覺敏銳的風險投資商早已著手挖掘和扶持本土與大數據產業相關的創業企業。隨著大數據時代的到來,中國本土創業企業正日益露出光芒。雷濤認為:“大數據會孕育更多新的公司類型,這也是大數據最有投資潛力的原因。‘數據礦’就在那里,分析平臺也已經成熟,現階段是要用解決問題的視角,尋找數據分析師和懂得商業操作的人才,把數據分析產品化”。
但是龐大而開放的數據挖掘、應用體系的形成并非易事。在本土化的大數據產業發展中,“基金+基地”創新的模式,無疑是一條可借鑒之路。
由北京云基地創立的“基金+基地”模式,是以自身的云天使基金,帶動海銀資本等資本力量,加上頂尖技術人群的入駐和加盟,形成資本、產業和創新力量直接對話。在北京亦莊開發區內,以硬件制造為主,北京云基地中的各企業業務都圍繞云計算展開,從云服務器到云箱再到云計算軟件系統平臺,分布在云產業鏈上的各個環節。
2014年,大數據基地將在北京投入建設,“基金+基地”的模式將得到復制和應用。雷濤告訴記者,之所以采用這一模式,是因為每個大數據應用的創業公司實際上都需要平臺、資本和客戶。提供辦公基地、引入資金,就能夠緩解大數據領域第三方公司的初期投資難題。