11月19日專電“一找照妖鏡”,最近這款應用在微博上火了起來。網民在該應用中輸入任意微博用戶名,就能查詢到該用戶的“真粉率”。網民們紛紛曬出一些大V的真粉率,加以調侃。
公司創始人徐亞波介紹,這款應用是通過微博接口抓取大量數據,在綜合分析基礎上形成了一個僵尸粉評定系統,并建立僵尸微博賬號數據庫。用戶輸入賬號名后,系統將其粉絲與僵尸微博賬戶數據庫進行比對,就可以迅速生成其真粉率。
這款應用是當前大數據時代掘金的成功案例之一。徐亞波透露,除“一找照妖鏡”這類公眾服務外,其公司還用數據挖掘技術向企業提供客戶精準定位、產品品牌分析等服務,企業客戶數量達三四千家,去年開始已經實現盈利。
由于信息生成、存儲和分享日益便捷,IDC預計,到2020年,世界上的數據存儲總量將達35ZB(1ZB等于1萬億GB)。有越來越多公司投入到大數據的分析和商機的挖掘。 谷歌公司通過對搜索數據的分析能預測流感的暴發時間、地域。美國聯邦政府的統一數據開放門戶網站催生了一項免費的航班延誤分析應用,顯著降低了航班延誤率。
國內,一個被業界反復提及的案例是北京朝陽大悅城通過大數據提升消費者體驗。大悅城有專門的信息部,在商場的不同位置安裝將近200個客流監控設備,通過分析客流走向改善商戶推廣手段,對車流的數據分析帶動了停車場的改造,以吸引優質的有車客流。
這些只是大數據展現潛力的開始。業內人士認為,如果結合物聯網的發展,使人與人的數據擴充到人與物、物與物,大數據還將再上一個臺階。
“很明顯感覺整個大數據產業是在上升勢頭。”徐亞波說。雖然產業界限和分工還不明晰,智夢創科等大量初創企業涌現,一些在傳統行業從事數據挖掘的企業也轉型進入大數據。
將手頭的巨量數據轉化成盈利,這個前景讓各行各業都開始心動。但業內人士擔心,“數據割據”的現實恐怕讓這個前景蒙上陰影。
互聯網大公司都掌握有部分消費者數據,其中,百度、騰訊、阿里巴巴集團三大互聯網巨頭分別掌握搜索、社交和消費數據。三方數據的匯總將拼湊出一個完整的網上信息圖譜。可惜的是,三方并無體現數據合作意愿,淘寶和騰訊微博先后屏蔽百度的蜘蛛爬蟲。
“互聯網巨頭都是封建割據思維,沒有認識到信息的流動才是互聯網的精髓。”長期關注大數據的知名IT經理人王冠雄表示,這些巨頭認識到數據將是未來發展的戰略性資產,不會輕易拱手讓人。“數據割據”造成大數據缺乏完整性和一致性,可利用價值大打折扣。
尤其對于處于大數據中下游的企業來說,如果缺乏數據源頭的支持,將“巧婦難為無米之炊”。幾位接受采訪的業內人士抱怨,目前雖然各大巨頭都嚷著要開放,其實是“掛羊頭、賣狗肉”,沒有真心誠意將數據源開放,或者只允許在其各自平臺上運行。
至于實體社會中的個體信息,更是封閉在工商部門、銀行、保險、公安、醫院、社保、運營商等機構手中,難以看到融合的曙光。這也是為什么除了以上兩例外,國內成功的案例其實寥寥。
當然,將所有數據熔于一爐,固然是巨大商機,但要遭遇巨大的倫理挑戰。如《大數據》作者涂子沛例舉的美國高院一項判例表示,“在一個有組織的社會里,幾乎每一則信息都在不同的時候以不同的形式公開過。但是,就個人隱私而言,不同時期零散地公開和一次性完整地公開,即使內容相同,也有本質的區別。”試想,若商業組織或者政府真把民眾的所有信息掌握在手,個體等若纖毛畢現,恐怕也是一件令人毛骨悚然的事情。