●大數據不是空中樓閣,只有從數據供給端到匯集、清洗和加工數據的中間端再到需求端,從打地基開始,一層層砌磚加瓦,才能筑起大數據應用的高樓
最近聽到剛邁入理想學府的堂弟回想起高考填報志愿時候的焦慮,“差點就找‘大數據’幫我算命了”。據說,今年一些高考志愿咨詢機構聲稱可以用大數據幫考生分析填報哪所大學、哪個專業為最佳。實際上,這種咨詢不知數據來源與規模,也拿不出分析模型,卻因為戴上了“大數據”的帽子而平添了幾分權威,即便叫價不菲,也讓考生趨之若鶩。
也許我們都曾被灌過這樣的大數據“雞湯”:大數據能夠告訴商家啤酒與尿布一起擺放會更暢銷,大數據比消費者自身更知道需要什么商品,大數據能幫你分析基因預防疾病……好像只要擁有足夠的海量數據就能預測一切。事實上,不少案例最終被證明不過是好聽的噱頭。大數據從足夠“大”到可以“用”,再到用來賺大錢,哪能一步登天!大數據不是一座空中樓閣,只有從數據供給端到匯集、清洗和加工數據的中間端再到需求端,從打地基開始,一層層砌磚加瓦,才能筑起大數據應用的高樓。
大數據要足夠“大”,先得有數據采集全覆蓋。從我國大數據應用情況來看,覆蓋的領域仍十分有限,多以互聯網企業為主,政府、公共服務、工業、農業應用才剛剛起步,其根本癥結也在于大數據產業鏈還未完善,無法壘起數據“高樓”。除了地理信息類和語音類數據之外,大多行業內還未實現數據采集、加工、分析和應用完整鏈條的建立。只有建立起成熟的大數據產業鏈條,求解大數據才能得出更加可靠深入的答案。
互聯互通,消除數據孤島,大數據才“有用”。在數據供給端,開放共享已經有了良好的開端。北京、上海都建設了政府數據開放網站,貴陽和武漢等地也上線了大數據交易平臺。前不久國務院常務會議審議通過了《關于促進大數據發展的行動綱要》,將推動數據資源的共享開放作為核心內容,力求以政府數據的率先開放形成巨大的示范作用,帶動提升社會認知,以政府應用為樣本推進企業機構數據意識的覺醒,加快全社會數據開放融通的步伐。
從“有用”到“會用”,離不開大數據服務商的培育。雖然阿里巴巴等一些擁有海量數據的企業開始通過大數據技術用于企業自身的決策發展和對外提供服務,但大多數用戶端企業尤其是傳統行業的企業還缺乏專業的數據處理分析手段,對能夠采集整合多源頭數據、分析處理非結構化數據的數據中介的需求十分強烈。同時,兼具技術、信息安全和法律責任的數據中介在很大程度上還能消解數據擁有者的顧慮,讓其對自身數據資源在市場中流通更具安全感。補上這一連接數據供給和應用的中間短板是我國大數據產業繁榮的必修課,未來應該著重鼓勵發展更多專業的數據中介。
擴大大數據的應用還需應用端自身發力。目前大數據的市場需求巨大,但只有探索更豐富實際的應用場景才能牽引數據供給和處理的發展。應用場景的開拓需要大量熟悉行業內特定情況與知識的傳統人才參與進來,解決選擇哪種類型的數據、得到大數據結果后如何指導實際行為等問題。
大數據從火到活是個慢動作,給大數據發展多一點耐心,慢慢完善成熟整體產業鏈,大數據在社會管理和經濟發展中才能真正活起來。