今年2月,中關村管委會在《加快培育大數據產業集群推動產業轉型升級的意見》發布會上表示,到2016年,中關村大數據帶動的產業規模將超過1萬億元,這還僅僅是中關村大數據產業的數字而已,放眼全球,大數據未來的“錢景”非常可觀。盡管大數據概念被熱炒,但與大數據相關的各種產品其實尚處在初期探索階段,比如利用大數據做預測,那么大數據到底可以給我們帶來什么?未來又該如何發展?
近來,有關大數據的討論可謂是沸沸揚揚,在今年世界杯期間,百度、谷歌、微軟和高盛等巨頭曾利用大數據技術預測比賽結果,最終百度以100%準確率“奪冠”。不過,百度在9月底推出的電影票房預測首次試水卻出現了一定的偏差,又引發了外界對大數據預測的質疑。
外界對大數據為何如此關注?首要原因在于,大數據預測可能會給某些人帶來利益,比如使用大數據預測股票走勢,如果這個準確率很高,那么自然會有更多股民去關注大數據。在世界杯期間,賭球的人不少,如果大數據可以對球賽做出精準的預測,那么在以后的重大體育賽事上,大數據也會扮演重要角色。
當然,除了這些層面之外,大數據還將為我們的生活帶來非常直觀的影響,比如通過大數據預測流行病,并對社會發出警示信號;又比如通過大數據統計和分析交通狀況,為緩解城市擁擠獻計獻策等等。應該說,未來我們的生活將與大數據息息相關。
從百度的案例來看,我們顯然已經對大數據預測有了一定的了解,不過,這其中的問題仍然值得我們思考,未來大數據應該從哪些方面提升準確率呢?
一方面,雖然大數據的應用范圍越來越廣,但并不是所有領域都存在大數據,也就是說,在某些方面,大數據的覆蓋范圍還沒那么普遍,在這種情況下,可能會出現一些失真的情況。
另一方面,對大數據預測而言,模型非常重要,在今年巴西世界杯期間,百度、谷歌、微軟和高盛等巨頭對全部64場比賽的勝負結果,以及冠軍和黑馬進行了預測。然而,無論是四分之一決賽還是16強淘汰賽,百度預測結果準確率都達到100%,甚至比高盛和谷歌的精準度還要高出很多。究其原因在于幾家巨頭采用了不同的預測模型,才導致了預測結果相差甚遠。
所以,未來大數據的發展將著眼于兩點,第一點是推動大數據繼續普及,造福社會;第二點是通過技術途徑不斷完善大數據模型,降低系統誤差,提高準確率。
在這方面,國內互聯網巨頭百度做的相當不錯。除了利用大數據對疾病和世界杯進行預測之外,百度還和聯合國開發計劃署合作,共建大數據聯合實驗室。據悉,該聯合實驗室的工作重點是利用百度的大數據技術對行業數據進行分析加工和趨勢預測,為聯合國制定發展策略提供建議,實驗室現階段的研究重點是環保和健康領域,未來還將聚焦教育和災害管理等議題。
在這一合作中,百度將獲得來自聯合國開發計劃署的海量數據,這些數據擁有極高的權威性和完整性,當然準確率也自然會得到大幅提升。當然,除了聯合國開發計劃署之外,越來越多的企業、機構也在和百度合作,共享大數據所帶來的價值,而這也必將豐富百度的大數據庫,為大數據預測提供更精準的數據素材。
另外,憑借百度在數據分析和數據處理方面的技術優勢,未來在大數據模型方面也將會有重大突破。基于開放云、數據工廠、百度大腦等先進的武器,應該說,百度在大數據預測方面已經建立了一套完整的體系,通過體系的協同工作,百度也必將持續提升大數據預測的成功率。