眾所周知,大與小是相對的。大數據究竟有多大?百度百科對“大數據”大的解釋是:“大數據或稱巨量資料,指的是所涉及的資料量規模巨大到無法透過目前主流軟件工具,在合理時間內達到獲取、管理、處理,并整理成為有效的資訊。”另據計算,2014年全球數據量如果下載的話,需要花費880億年。
然而,再大的數據也是人們一點一滴聚沙成塔、集腋成裘的。換句話說,沒有小數據的積少成多、百川歸海,大數據也是無源之水、無本之木。這里所說的小數據,是指每個行業、每個單位、每個人生產或使用的數據。對我們統計人而言,你搜集的每一筆原始數據,你填報的每一張報表,你撰寫的每一篇分析,乃至你為了數據的“翔實客觀,沒有被污染,沒有被摻水”所作的種種努力,都是小數據的點點滴滴,都是大數據的源頭之水。站在這一高度,每一個統計人都已置身在大數據的時代浪潮中,都有責任在統計的航船上,認準方向,找準位置,做一個合格的劃槳人。
《大數據時代》的作者維克托·邁爾-舍恩伯格認為:“大數據將帶來對人的重新認識,不是在阿波羅神廟,而是在小世界網絡中,認識你自己。”時代的巨變是啟迪人們重新認識自己、認識世界的最好契機。在小數據時代統計曾有信息主體的自豪與自詡,但跨進大數據時代,統計在歡呼應用空間更加開闊和用武之地更為拓展的時候,也應清醒地看清和認識自己的地位、局限和挑戰。在大數據的海量和技術里,統計是非常重要的一塊,但只是“一塊”,而不是全部。“統計是數據的科學”,但“數據的科學”不僅僅是統計。
這樣認識統計并非自我菲薄,而是為了找準統計在大數據時代的定位,更好把握統計數據與整個大數據的關系,使統計真正成為大數據時代的驕子。在大數據方興未艾、眾說紛紜的當今,統計人明了自己與大數據和小數據的關系,既抓大也不放小,既放眼宏觀也著手微觀,既講數據技術也講數據文化,才有可能腳踏實地走上大數據的坦途。
聯系所謂大數據與小數據思考,覺得梁植的演講,在具體事例和細節中,把小數據與大數據的息息相關詮釋得透辟清晰。雖然沒有大數據與小數據的概念或推導,但讓人悟出道理和邏輯上的血脈相通。
統計人在本職本崗耕耘收獲的“小數據”,自然會成為大數據的一部分。成就大數據的人是無數努力造就小數據的人,在這些人中,統計人應當當仁不讓,拼力成為當之無愧的專業之師、生力之旅、奉獻之魂。這些人和他們為之努力的“小數據”,雖然只是大數據的“滄海一粟”,但大數據的滄海就是這樣的集合匯聚而成。
D1Net評論:
由此可見,數據的江湖,有波瀾壯闊,也有細流漣漪,相輔相成,相映生輝。讓我們在大數據時代,做好小數據,用好大數據。