以BAT為代表的中國互聯網企業,在數據領域各有千秋,百度的搜索數據、阿里的電商數據、騰訊的社交數據。對于手里的數據如何使用,這些公司正在嘗試數據采集、計算引擎、數據加工、數據分析、機器學習、數據應用等數據生產全鏈條。
誰擁有中國最多的數據,答案是80%以上的數據都掌握在政府手里;那么誰是中國最大的大數據企業,是BAT中的某一家,還是銀行、通信運營商、制造工廠……
6月份,騰訊發布了一份用大數據描繪的中國數字經濟地圖。這份覆蓋335個城市的《中國“互聯網+指數”(2016)報告》的發布,吸引了千余名中國政府官員到場。除了區域數字經濟排名,在大數據行業人士看來,此次發布會也是騰訊系大數據圖譜的首次集中亮相。
以BAT為代表的中國互聯網企業,在數據領域各有千秋,百度的搜索數據、阿里的電商數據、騰訊的社交數據,即便放到世界范圍內來看,其規模都不容小覷。
對于手里的大數據如何使用?馬化騰和李彥宏都提到“人工智能”,李彥宏稱大數據將開啟人工智能時代。馬云則公開表示,阿里要做的是數據公司。至于如何用數據掙錢,現在他也不知道。
騰訊系圖譜
騰訊發布的2016年中國“互聯網+指數”,使用的數據規模驚人。
騰訊研究院首席經濟學家孟昭莉介紹,此次“互聯網+”指數使用的是真正意義上的大數據。騰訊研究院匯總了微信、手Q和公眾號超過20萬億次的閱讀點擊量、數百億筆支付數據、全年約1300億次視頻點擊量;70億次新聞點擊量、微信城市服務超1.2億人次應用數據、遍布全國的一萬余個有效創業項目、四十余萬款上線APP數據等。
這些數據總量,超過73500000 GB,相當于800個世界最大圖書館——美國國會圖書館藏書的容量,最終從海量數據中得到121個指標數據集。
參與報告撰寫的騰訊研究院研究人員告訴21世紀經濟報道記者,2016年的最新報告,相對去年的報告數據量更大,覆蓋面更廣泛,包括了騰訊在前兩年投資過的京東電商數據、攜程的旅游交通數據,還有滴滴的交通數據等。
在操作層面,除了騰訊的內部數據,還由馬化騰親自出面,“收集”京東、滴滴、攜程、新美大的數據。
其中,京東大數據研究院掃描超過20億行、總量25 TB的數據,得到3個指標數據集,滴滴研究院匯總2015年全年訂單得到2個指標數據集,攜程匯總數億用戶的訂單數據得到4個指標數據集,新美大匯集數億活躍買家、數千萬商戶得到5個指標數據集。
上述報告中的數據,只是騰訊數據的一部分。
在今年5月的數博會上,馬化騰透露,騰訊有18年海量運營數據,目前整個數據存儲中心存儲總量超過1000個PB,大于15000個全世界最大圖書館的總量,而且每天以500TB的數據量上升。
在圖片、視頻以及移動支付方面,數據數量也非常驚人。除夕時,微信紅包數量每天超過25億筆,目前也穩定到每天超過5億筆的數字。
人民大學長期研究網絡經濟學的副教授程華評價,這些數據不僅對企業自身發展,對于中國數字經濟發展都很有意義。
在大數據領域的創業公司看來,這些社交、電商以及交通數據,將在行業發揮重要作用。21世紀經濟報道記者采訪期間,不止一家數據公司提到,希望能跟像騰訊這樣的大數據公司有合作渠道。
大數據生態圈
無疑,大數據正在成為企業的核心資產之一。
報告發布當天,除了馬化騰,還有貢獻數據的京東集團CEO劉強東、大眾點評網CEO王興和58同城CEO姚勁波等,來現場的還有攜程、滴滴等互聯網企業高管,同時為騰訊系大數據圖譜站臺。
這些企業的數據,基本覆蓋了交通、旅游、餐飲、零售等第三產業的方方面面。這些公司背后都有騰訊直接或者間接的投資。
在騰訊的內部研討會上,騰訊一位高管介紹,大家都在喊數據開放,法律意義上的數據開放,是指政府數據開放,任何一家商業企業沒有義務開放自己的數據。
對于這份報告,他表示,騰訊今年算是找到了一個方法,在不拿投資公司原始數據的情況下,以百分比的方式,構建一個指數。
21世紀經濟報道記者梳理發現,包括騰訊投資的公司在內,整個騰訊系的大數據版圖,其布局的廣度和深度,已屬國內企業的佼佼者。其布局已經到了全面完善生態圈的對外合作階段。
貴陽數博會上,馬化騰闡述了騰訊大數據生態圈思路:“出行領域的滴滴打車,每天有超過上千萬單的出行記錄,數百萬車輛實時把地理位置信息和我們的平臺一起匯集;再比如京東有數萬名送貨員,每天有大量的貨物在流轉,會產生很多實時數據,甚至精準到家庭地址;像O2O領域,美團有數百萬家商戶和送餐服務的地理位置信息。”
馬化騰表示,這些信息掌握在整個生態領域的各個伙伴手里,希望匯總起來反哺給合作伙伴。
以58集團加入騰訊的生態圈為例,58集團CEO姚勁波談到“58和騰訊的連接”時說,第一層意義是,平臺用戶量越大就越好用,交易的頻次,達成匹配的效率就會變高,他們希望更多地進入到QQ、微信里,讓用戶在更大的平臺,以更高的效率完成交易;另外,一旦商戶與用戶能在線實時溝通的話,服務的本質也會發生變化,會讓雙方的體驗進一步提升。
企業之間的大數據合作和共享,在近兩年的資產市場動作不斷,吸足了眼球。
今年6月份,跟大數據相關的最大一筆交易,是微軟以262億美元的價格收購領英,也是微軟歷史上數額最大的收購交易。領英聚焦職業社交網絡的大數據資源,被認為具有豐富的商業價值。
數據生產全鏈條
對于微軟天價收購領英,中關村一家大數據公司CEO告訴21世紀經濟報道記者,很大的可能,就是LinkedIn提供的社交數據,對微軟未來的布局很有用。
大數據如何實現商業價值變現,下一個風口是什么?北京幾乎每天都在舉行討論這些話題的論壇。BAT大佬關于“風口”判斷的演講,對很多人來說,總有著魔性一般的吸引力。
互聯網的數據價值幾何?怎么商業化變現?馬化騰如此總結下一個風口——未來是傳統行業利用互聯網技術,在云端用人工智能的方式,處理大數據。
聽眾聽完這句匯總當下最熱概念的句子,似乎也沒有太聽明白。不過,互聯網企業的大數據被看好,是毫無疑問的。
從國內備受矚目的BAT大數據布局來看,各家的大數據各有特點。騰訊有QQ和微信兩張王牌,擁有世界上最龐大的社交數據。他們的數據吸引了研究機構、創業公司的目光。
馬化騰和張小龍均在公開場合表示,用戶在微信上花掉了太多的時間。不得不說的是,微信的社交數據超過了任何一款互聯網產品,而在整個騰訊生態中,關于地理信息、交通、醫療、體育、電商數據,幾乎全面覆蓋。
百度以搜索數據為主,作為一家占據中國搜索市場絕對份額的公司,自然匯集了海量的數據。
2014年8月開始,百度推出基于大數據的經濟指數預測產品——百度經濟指數,一個是中小企業景氣指數,一個是宏觀經濟指數預測。同時,在數據商業化方面,李彥宏認為,人工智能是最能應用大數據的領域,大數據將開啟人工智能時代。
“為什么人工智能這么火,主要是因為越來越多的大數據被重視與運用,計算能力越來越強大,計算的成本越來越低,大數據的應用就越有實現的價值。”李彥宏在今年的貴陽數博會上說。
最早提出“DT時代”的阿里巴巴,擁有強大的電商數據。馬云在多個場合強調,阿里巴巴是一家數據公司,賣東西是為了獲取數據。
阿里研究院針對自身數據,也早就推出各類指數報告。阿里龐大的電商數據,已經成為各大研究機構、咨詢機構、金融機構以及政府部門關注的重要參考。
阿里研究院高級專家潘永花告訴21世紀經濟報道記者,針對清洗后的電商數據,阿里研究院做了系列的研究產品,有一部分會公開和定期發布。
比如其公開發布的產品,包括阿里巴巴網購價格指數與核心商品價格指數。
前者反映網購平臺上支出平均價格水平變化,后者反映網購主流商品的一般物價水平變化。阿里巴巴網購核心商品價格指數從2014年6月9日開始按月發布,已成為宏觀經濟以及主流商品價格變化的重要參考。
另外,阿里還根據這些數據產生出不少新的業務,比如阿里巴巴商家事業部今年發布了聚星臺,其核心就是用數據賦能商家,幫助商家更高效地實現品牌客戶運營。
潘永花介紹,阿里巴巴的大數據能力除了賦能原有的電商生態外,2016年他們通過“數加”大數據平臺正式對外輸出,涵蓋了數據采集、計算引擎、數據加工、數據分析、機器學習、數據應用等數據生產全鏈條。
馬云在公開場合表示,我們也不知道如何用數據掙錢,但我們知道人們的生活將離不開數據。