目前大數(shù)據(jù)技術(shù)手段已經(jīng)豐富運(yùn)用于各行各業(yè)。據(jù)統(tǒng)計(jì),2015全年中國大數(shù)據(jù)項(xiàng)目規(guī)模超過100億,預(yù)計(jì)到2020年中國企業(yè)級(jí)大數(shù)據(jù)市場應(yīng)用規(guī)模將突破200 億元。如何利用技術(shù)手段將大數(shù)據(jù)變現(xiàn)為產(chǎn)品,挖掘其商業(yè)價(jià)值成為諸多技術(shù)企業(yè)的課題。
日前大數(shù)據(jù)產(chǎn)品平臺(tái)天眼查聯(lián)合國際數(shù)據(jù)挖掘協(xié)會(huì)中國分會(huì)(KDD China)在滬舉辦 “掘金公開大數(shù)據(jù)背后的商業(yè)價(jià)值”大數(shù)據(jù)論壇。天眼查創(chuàng)始人柳超在論壇上表示,大數(shù)據(jù)的價(jià)值體現(xiàn)需要通過數(shù)據(jù)清洗整理、服務(wù)調(diào)用和產(chǎn)品化三種手段。“產(chǎn)品化才是能夠讓普通的用戶都能感受到大數(shù)據(jù)的價(jià)值魅力的最高層級(jí)的數(shù)據(jù)處理形式。”
柳超指出,目前大數(shù)據(jù)行業(yè)中醫(yī)療、消費(fèi)、金融等私有數(shù)據(jù)的市場規(guī)模占大部分,無疑也是大數(shù)據(jù)挖掘領(lǐng)域的紅海。但是私有數(shù)據(jù)因其私有性,連接性差、流通壁壘高,相較于公開數(shù)據(jù),對私有數(shù)據(jù)進(jìn)行挖掘后的價(jià)值增值空間并不明顯。但與私有數(shù)據(jù)不同,公開數(shù)據(jù)是指每個(gè)人都能夠訪問的數(shù)據(jù),具有公開、透明、種類繁多等特征。
“人們?nèi)粘I钪须S處可接觸到的諸如行政處罰信息、土地出讓公示、法院公告、新聞、外匯交易信息、股票交易信息、商標(biāo)公示信息、專利公示、域名備案、水質(zhì)量、城市污染查詢、災(zāi)害預(yù)警、航班動(dòng)態(tài)等等都是公開數(shù)據(jù),但卻較少人關(guān)注其價(jià)值,較少有機(jī)構(gòu)能夠有挖掘其價(jià)值的技術(shù)能力,因此價(jià)值挖掘空間大。”柳超說。
香港科大計(jì)算機(jī)系主任楊強(qiáng)教授也在論壇上表示,少量公開數(shù)據(jù)的獲取難度不大,但是真正對于商業(yè)決策有幫助的大量公開數(shù)據(jù)的收集難度是很大的,搜索、整理、挖掘、呈現(xiàn)出其中的關(guān)聯(lián)關(guān)系、并呈現(xiàn)出一個(gè)具象化的結(jié)果,這個(gè)難度就更大,所以我們需要一個(gè)更加高效、直接的方法幫助我們把雜亂信息轉(zhuǎn)換為決策支持。 業(yè)內(nèi)人士指出,大數(shù)據(jù)行業(yè)常面臨著“有數(shù)據(jù)的沒技術(shù),有技術(shù)的沒數(shù)據(jù)”的困境,數(shù)據(jù)和技術(shù)兩方無從信任,常常難以合作,此時(shí)公開數(shù)據(jù)無疑是合作雙方的試金石,公開數(shù)據(jù)的產(chǎn)品化是連接數(shù)據(jù)孤島的橋梁。據(jù)介紹,目前天眼查已經(jīng)構(gòu)建了完整的、集數(shù)據(jù)采集、數(shù)據(jù)清洗、數(shù)據(jù)聚合、數(shù)據(jù)建模、數(shù)據(jù)產(chǎn)品化為一體的公開大數(shù)據(jù)產(chǎn)品,針對政府機(jī)關(guān)、金融機(jī)構(gòu)、律師事務(wù)所、傳媒機(jī)構(gòu)等多個(gè)領(lǐng)域提出大數(shù)據(jù)解決方案。