大數據以勢如破竹的姿態高歌奮進,比起最初的“猶抱琵琶半遮面”越來越直觀形象。作為一個天天與數據親密接觸的統計人員,對大數據知識卻知之甚少,于是徘徊在大數據的門前,除了了解網站上一些關于大數據的詮釋與解讀,也粗讀了舍恩伯格的先河之作《大數據時代》,對大數據有了一個初步的概念框架,冰火兩重天是我眼中的大數據標簽。
在這個字符堆疊的網絡時代和信息世界里,網民的纖纖細指就代表了絕對民意,在百度“大數據”上,綜合搜索排名、超人氣移動搜索指數告訴我們誰穩坐“收視第一”、“一哥一姐”寶座,大數據會說話,它會精確告訴你男女比例、年齡構成、地域分布等關注人群的各種訊息,甚至可以根據這些信息決定電視劇、電影何時何地針對何人拍攝,票房更能超預期。
導演張一白執導了消費“80后”青春的《匆匆那年》,把15年的時光切成一個個碎片,拼湊出了這代人無法安放的青春。因為“80后”為貢獻票房的主力軍,他們看的不只是電影,還有自己的回憶、感覺及情緒。與此同時,選在2014年12月份上映,即將揮別過去,網友們會用“匆匆那年到匆匆這年”來回顧自己這一年,所以《匆匆那年》成為觀眾最重要的情緒宣泄口,那些一路伴隨著我們走過的人,一起激活過去的共同回憶,相比其他電影,《匆匆那年》的一大優勢,就是它給了觀眾一個回顧和緬懷過去的理由,一個和老朋友老同學相聚的理由,觀眾會為了這個理由買單。而電影只是造夢的工具,這個夢里有自己,有死黨,有酸澀的初戀,有動人的友情,《匆匆那年》通過一些網絡大數據恰好讓這些美好時光照進了現實。所以數據時代,網民點擊才是人氣,是民意,更是成績單。
大數據也運用于各種運動賽事,搜集對手資料,然后研討戰略,分析結果,德國在2014世界杯勝出竟然是得益于應用數據分析最到位,一臺IPAD就算出對手布局漏洞。在交通上,坐車的人、開車的人甚至包括車都是大數據的一分子;在移動通訊里,我們的通話記錄瀏覽歷史甚至手機型號都是浩瀚數海的一部分,在這世界上沒有比數字更真實的東西。
會當凌絕頂,一覽眾山小。數據大亨百度在山西投資上百億元建立大數據處理中心,并嘗試在搜索引擎中裝備“大數據”馬達,讓搜索先“大”起來。比如,實物識別功能,只需將手機對準一朵鮮花,通過“大數據”處理,屏幕會立即顯示出此花的名稱、特性、種植要點等,還會逐一呈現類似鮮花。這只是大數據的大材小用,百度又隆重推出為傳統企業互聯網轉型服務的“直達號”,用戶只須用手機@商家賬號,并提出任何服務需求,百度立即可以上傳至“大數據”,通過“云計算”將商家與用戶零距離溝通,讓供需方迅速“直達”,實現需求。
以上是大數據的火,任何一個新生事物的出現,都是一把雙刃劍,大數據無疑也是冰火兩重天,允許我引用一個小笑話來說明。
某比薩店的電話鈴響了。
客服:“XXX比薩店。您好,請問您有什么需要?煩請先把您的會員卡號告訴我。”
顧客:“16846146***。”
客服:“陳先生,您好!您是住在泉州路一號12樓120x室,請問您想要點什么?”
顧客:“我想要一個海鮮比薩……”
客服:“陳先生,海鮮比薩不適合您,根據您的醫療記錄,你的血壓和膽固醇都偏高。您可以試試我們的低脂健康比薩。因為您上星期一在中央圖書館借了一本《低脂健康食譜》。”
顧客:“好,那我要一個家庭特大號比薩,要付多少錢?”
客服:“99元,這個足夠您一家6口吃了。但您母親應該少吃,她上個月剛剛做了心臟搭橋手術,還處在恢復期。”
顧客:“那可以刷卡嗎?”
客服:“陳先生,對不起。請您付現款,因為您的信用卡已經刷爆了,您現在還欠銀行4807元,而且還不包括房貸利息。您也不能去提款機取款,因為您已經超今日提款限額。”
顧客:“你們直接把比薩送我家吧,家里有現金。你們多久會送到?”
客服:“大約30分鐘。如果您不想等,可以自己騎車來。根據我們全球定位的自動跟蹤系統記錄,您有一輛車號為SB-748的摩托車,而目前您正在解放路東段騎著這輛摩托車……”
兩年前,騰訊QQ曾經推出朋友圈功能,它基于用戶的好友關系以及其他資料進行分析,準確推出用戶的真實姓名。很多用戶的真實名字出現在朋友圈中,用戶的強烈抗議導致騰訊關閉這一功能。用戶真實姓名被騰訊朋友圈曝光僅僅是用戶隱私泄露的一方面,這背后的數據分析才是令用戶倍感恐怖的地方。試想,如果騰訊QQ沒有掌握到用戶的隱私,如何知道用戶的真實姓名,以及真實的社交關系?當使用電子郵件、社交網絡的時候,你的信息正在被記錄下來,發表的言論或者分享的照片、視頻等都決定著互聯網運營商即將向你推薦什么樣的資源和廣告;當你在享受著視頻監控帶來的安全感的同時,你也是被監控的一分子,你的一舉一動都會暴露在鏡頭下面;你用手機通話時,運營商不僅知道你打給誰,打了多久,還知道你是在哪里進行的通話,試想當你什么舉動都可以被預測,相當于你裸體暴露在陽光下,換成你,害怕嗎?
這些都告訴我們,我們的隱私在大數據時代遭遇前所未有的一覽無遺,如何保證公民信息不被濫用亂用,公民隱私不肆意流離失所,需要我們法制之劍拋光磨亮,青鋒出鞘,亟待我們政府信息之門張弛有度,動靜結合。
不管怎樣的冰火兩重天,大數據的公開與分享已經成為大勢所趨,政府部門必須身先士卒。2014年10月28日,中國國家統計局和聯合國統計司聯合舉辦“大數據和官方統計”國際會議,馬建堂在致辭中指出,當今世界正在經歷一場偉大的“數據革命”,政府官方統計同樣面臨著大數據時代的挑戰、影響和難得的發展機遇。中國官方統計始終以開放的姿態和創新的勇氣,真誠擁抱大數據,傾力使用大數據。
看過作家劉震云講述的一個故事,他在德國杜塞爾多夫訪問的時候,跟德國朋友在萊茵河邊吃飯,閑聊之際順口問萊茵河有多深?結果幾個德國朋友很緊張,湊在一塊嘀咕半天,劉震云很好奇,德國朋友說,這個問題特別難回答,因為萊茵河的水深春天和夏天不一樣,夏天和秋天不一樣,而秋天又和冬天不一樣,很難說出一個確切數據。而這個問題換作是我們,可能會馬上告訴別人大概多少米。歷史學家黃仁宇說中國最缺乏的就是數字管理,所以,大數據并不是一個充斥著算法和機器的冰冷世界,人類的作用依然無法被完全替代,對于我們政府統計部門來說,首先養成用數據說話的意識和習慣,比大數據本身,更為重要。
我相信,大數據為我們提供的不是最終答案,只是參考答案,更好的方法和答案還在不久的未來;我亦相信,未來的大數據的發展會如舍恩伯格所說的,是一場生活、工作與思維的革命,會給我們帶來更多更多的美好。