“數據就像是一個神奇的鉆石礦,在其首要價值被發掘之后仍能不斷產生價值。”在維克托看來,數據的真實價值就像漂浮在海洋中的冰山,第一眼只能看到冰山一角,而絕大部分則隱藏在表面之下。
大數據能創造切實的真金白銀
國內外很多科技公司都試圖潛入冰山底部,將技術黨手里的數據變成切實的真金白銀。
“銀行最值錢的是什么?數據!阿里巴巴最值錢的是什么?數據!騰訊最值錢的是什么?用戶數據!都是數據。”在貴陽大數據交易所總裁王叁壽看來,如果未來一邊是“互聯網+”,另一邊就是“大數據+”。
大數據產業聯盟會長董力明對此也表示認同,互聯網和大數據將是未來社會變革的兩個非常重要的引擎,幾乎會變革所有的行業。大數據目前可能只是改變了部分行業,比如電商、通訊業,下一步可能會改變O2O,改變傳統的餐飲娛樂行業,將來工業、農業、金融投資相關的行業都會被大數據改變。
“互聯網同時會產生非常多的數據,人類社會的數據量是每12個月到18個月翻一番,你能夠想象到未來的數據量有多大。誰能夠解決這個巨大的挑戰,誰就能從中創造出價值,這也是為什么互聯網公司、技術類公司都這么關注大數據、積累大數據資產和大數據技術的原因。”董力明向《經濟》記者表示。
大數據跟政治、經濟、商業、文化、生活方方面面都有關系。每個人的行蹤都是一種數據,呼吸是一種數據,就餐行為、交通習慣甚至刷一張信用卡都是數據。
隨著數據樣本越來越多,大數據會變成一個更加廣泛的應用工具。“每一個事物、每一個人將來都可以用數據描述出來。”中金標準數據公司總經理郝文嘉向《經濟》記者表示,整個社會依靠數據而連接,變成數據驅動型的國家,這是必然趨勢。
在王叁壽看來,這種趨勢為數據企業創造了巨大的生存空間。“大數據這個行業是唯一一個能彎道超車的行業,因為目前沒有哪家公司能壟斷數據行業,唯獨大數據這個行業可以繞過行業巨頭。”
數據的價值需要通過應用才能體現出來。“我最看好幾個領域的數據,一是金融;二是醫療大數據;接下來是能源大數據、交通大數據和一些商品、物流大數據,這些領域的大數據是比較容易變現的,有很強的買單能力。”王叁壽說,整個大數據產業,可以做到一萬億、兩萬億,甚至三萬億這樣的產值。”
中國通訊協會常務副理事長張新生也向《經濟》記者表示,未來在醫療、工業、企業營銷、城市建設等方面,大數據都有著很大的應用空間。
郝文嘉透露稱,目前把大數據應用最好的還是金融行業,“金融領域是對大數據領域接受度最高的,可能是因為銀行、券商、基金公司對數據的渴求,他們對數據非常敏感,接受度也很高。”
而在董力明看來,大數據對于行業的作用往往取決于行業本身的價值和體量,“比如說電信行業、金融行業,本身體量就很大,大數據給它帶來的價值也就很可觀”。
數據采集的成本是遞減的
經過了幾年的蟄伏,數據公司開始集中浮出水面。記者了解到,目前國內大概有800多家大數據公司,形形色色大概分了接近30多個品種,涵蓋了金融大數據、醫療大數據、能源大數據、交通大數據等多個領域。
“現在成立了很多交易的平臺,中關村就有,它幫你抓取數據,自己建個平臺做搜索。”張新生透露稱,目前建立這種平臺的技術已經成熟,就看誰的方法更具創新性。
除了這些平臺公司抓取來的資源,大部分數據資源都掌握在政府部門、互聯網企業、運營商、金融機構里,例如百度做的是社會數據,騰訊做的是社交數據,阿里巴巴做的是電子商務。每個公司掌握的數據類型都不太一樣。
在張新生看來,數據走向商品要經歷固化信息痕跡、提取數據價值、分析挖掘、可視化,最后到應用這些流程。
而在目前的大數據產業鏈條上,主要有四個梯隊:第一梯隊主要做IT基礎建設,例如IBM、華為、中金;第二梯隊是做數據存儲、軟硬件服務;第三梯隊做大數據應用;第四梯隊做大數據交易。
這些梯隊中,有先來者,也有后來者。
“我們研究了那么多年,已經到了整合彌補數據缺陷階段,其實從社會各方面來說,業內也有很多人在做這種數據,大家形成了共識,盡快把這條鏈建立起來。”郝文嘉說。
而在王叁壽看來,現在已經到了爬上山頂看太陽的階段,“在大數據領域,創業就像爬泰山一樣,前幾年所有做大數據的公司都在爬山,這兩年陸陸續續地開始有一些大數據公司爬到山頂上去了”。
“過去靠弄點兒數據就想去賺錢并不容易。但我們覺得這個趨勢沒問題就一直堅持,最開始在2011-2013年一分錢沒賺,從2014年開始盈利,2015年開始有個爆發期,北京銀行現在一個支行買我的大數據終端,一個終端30萬一年。”據王叁壽透露,現在有一些數據公司已經開始賺錢了。
前幾年就開始做數據的公司無疑選擇了一個非常好的創業時間點,“現在再去重新匯集數據已經來不及了,再過三五年市場變天了”。在他看來,大數據這個行業想投機取巧是不行的,它需要很長時間的積累。
王叁壽認為,大數據公司能做得好要取決于三個方面:第一,要有很廣泛的合法的數據采集渠道;第二,要有非常強的數據建模能力;第三,要有設計應用場景的能力,考慮如何讓一些機構用了數據之后可以購買更廉價的機票。
那么數據采集的成本如何?“這個成本其實是一次性的成本,你只要把數據采集渠道打通了,以后就像水管一樣,每天就往里面流水,流進來流出去,關鍵建水池和鋪管道這個過程是需要時間的。”王叁壽說,數據采集的成本是遞減的。
大數據收益由平臺和賣方四六分成
在董力明看來,數據采集、數據存儲最后還是要實現數據交易,否則就沒有意義。而在我國,目前僅僅成立了貴陽大數據交易所一個平臺,其有望成為數據領域的深交所、上交所。
“貴陽大數據交易所是大數據產業發展過程中的執牛耳者。”王叁壽說,沒有大數據交易所誰都沒有辦法去整合中國的大數據產業,“政府數據公開總要有個渠道,這個口子在哪里呢,不是說幾個公司就把它公開了,這是不行的,政府自己直接公開也不行,因為需要做清洗、脫敏、建模、分析,所以交易所也是政府部門日后公開數據的一個出口。”
由此,大數據交易鏈條的三個方面都已具備:數據賣方、平臺和數據買方。據王叁壽介紹,交易所分得數據收益的40%,60%將返給數據賣方。
那么當大數據脫下技術外衣,它的交易流程是什么樣的,誰愿意買,買的又是什么?為此,貴陽大數據交易所相關負責人也向記者舉了一個生動的例子進行說明。
“大家好,我是一串數據,出生時被命名‘李麗’,記錄了貴陽市民李麗在醫院就診的歷史信息。今年4月份,我和兄弟姐妹被衛生部門送進一個大數據交易平臺。進入平臺之前,衛生部門給我們洗了一次澡。據說,這叫‘數據脫敏’。”在經過數據脫敏后,和李麗相關的私人信息都不見了,數據代號由“李麗”變成“X”,只記錄了一位不知名的44歲的貴陽女性的病史。
脫敏成功,該數據正式進大數據交易所了。這個聽起來“高大上”的交易所,和淘寶一樣,是一個虛擬的交易平臺。“剛進門,我聽見衛生部門和平臺的管理方在商量,談了我到底值多少錢。等他們定完價,我就被標上價格,進入平臺展示窗口,等待買家。最終,貴陽市一家制藥公司看中我,價格也合適,老板把我和數以百萬計的兄弟姐妹一起打包買走了。具體交易額是多少?保密!收益由平臺和衛生部門四六分成。”
到達制藥公司后,通過深度挖掘系統,制藥公司有針對性地推出新藥,最后賣給“李麗”這樣的市民。
數據交易流程都與以上例子類似,但是在數據來源、種類、重要程度都不同的情況下,大數據如何定價就成了一個問題。
王叁壽表示,數據將進行自動計價連續交易,交易所將針對每一個數據品種設計自動的計價公式,數據買方可以通過交易系統查詢每一類數據的實時價格。“當數據買方應約價等于或高于賣方掛牌價時,按照交易所自動撮合成交,成交價為買方應約價格;對于不能自動成交的應約,賣方可選擇能接受的應約與其成交,成交價為買方應約價;因為數據買方不一定需要全部的數據樣本,這個時候,我們系統將對數據設定拆分原則,系統自動報價,而后自動撮合成功成交。”
并不是所有人都可以在平臺上購買這些大數據。記者了解到,交易所對數據買方也進行了一些限制,暫時不允許任何個人購買交易所的數據。同時在監管不健全的情況下,外資數據買方購買數據之前需要進行資格審查。從這個角度來說,也在一定程度上保證了數據的流向。