摘要 : 我們已經置身大數據世界,被大數據所影響,不論是你是否感知是否承認,你都在為大數據世界貢獻著數據和樣本,并受益于此。
這幾天,世界上最大規模的“動物遷徙”運動——中國春運達到最高潮。CCTV“據”說春節專題報道,利用百度遷徙、百度指數等大數據產品宏觀、直觀地呈現春運這一年度事件。想必大家對去年“百度遷徙”以煙花般絢麗的圖層呈現春運大潮依然記憶猶新,今年百度遷徙升級到2.0版,增加了百度天眼、機場熱度、車站熱度等新的視角,這反映了春運的變遷,背后是大數據技術的升級。
新時代春運:“飛躍”時代到來
隨著中國經濟高速發展,承載春運的交通工具已從綠皮車升級為高鐵、飛機、自駕多種方式,航空這種過去“高大上”的出行方式已成為普通人的選擇。根據民航局預測,2015年春運期間,預計全國民航客運量將達到4752萬人次,相比去年同期增長8%。
中國的“空中市場”還在不斷普及。2014年英國《金融時報》報道,波音副總裁預測中國2033年將取代美國成為世界最大的航空市場,中國在未來20年里購買6000架客機,中國的機隊規模將增至現在的3倍。與機隊規模增長對應的是,飛行價格的大幅下降:國內機票幾百元已常態化,甚至不少航線已低過對應的高鐵。另外,機場接駁城市地鐵的發達、燃油附加費的下調、機票購買渠道的便捷性都成為飛行這一出行方式普及的推動力。
在越來越多游子們選擇“飛回家”的大背景之下,百度遷徙今年特別引入了飛行大數據:透過百度天眼可實時查看航班軌跡,天上有哪些飛機正在飛行、飛到了哪里都一目了然。點擊對應飛機和航線還可查看飛機型號、機齡、起降時間、有無晚點等詳細信息,甚至可以像機場塔臺一樣看到飛機經緯度、速度、海拔等數據。百度還借助LBS大數據提供機場熱度展示,新聞報道可以根據這一數據了解全國機場人流密集程度,直觀呈現春運現象。不論是百度天眼還是機場熱度,都將冷冰冰地數字轉化為直觀的圖像呈現在我們眼前。
大數據:多維度交叉運用更具價值
CCTV“據”說春節引入了百度遷徙、百度熱力圖、百度指數多個大數據產品,全方位詳實地報道春節,涵蓋春節期間人們的吃穿住行諸多方面。除了春運這個最受關注的遷徙運動之外,讓我印象深刻還有一個“中國人對煙花爆竹的態度”報道。
CCTV通過可視化報表呈現了不同區域、不同城市的人們對煙花爆竹的態度,結論是一二三四五六線城市越到后面,對煙花爆竹關注度越高,這說明大城市對煙花爆竹管制更嚴格,同時也說明民俗在農村、四五六線城市保留更完善。這個可視化報表并不需要像過去那樣通過“問卷調查”這么高成本獲得,數據來自百度指數,百度指數則是根據用戶搜索關鍵詞、用戶所處位置這些“大數據”挖掘得到。
如果大家留意到CCTV“據”說春節欄目,對于大數據與我們生活的結合正在日趨緊密相比更有認同感。它可以了解人流整體遷徙特征、不同地段人流分布情況、不同城市人們在關注什么、不同年齡段人們在春節的興趣,等等。而能夠做到這些,就必須要掌握海量用戶各種維度的數據。實際上,擁有大數據的企業并不少,比如地圖玩家都有LBS數據、騰訊有用戶聊天數據、航班管家這類App擁有航線數據、12306則有鐵路出行相關數據,但這些玩家要么數據比較單一,要么不具備挖掘的能力。
百度之所以在大數據上能夠走得最快,成為CCTV等權威媒體報道的數據來源,核心在于兩點:百度擁有多維度的交叉大數據:LBS、搜索、團購等等,并且具備把這些數據關聯交叉并進一步挖掘的技術。百度遷徙、百度熱力圖、百度預測這些產品背后其實都是數據和技術在支撐。
大數據正在從“絢麗”到“實用”階段
如果看回幾年前的“云計算”,不少人都覺得這是噱頭、是概念,但現在云存儲、云視頻、云計算都已成為主流應用。在我印象中,大數據在去年都還被不少人認為是噱頭,不過現在它同樣已進入了“不再是噱頭而是常態”的階段,人們正在適應大數據與生活的緊密結合。從“百度遷徙”的升級便可對大數據的發展見微知著。
百度遷徙去年推出后,不少人都贊嘆:華麗、牛X、炫酷。可以對于它具體能夠做什么,還是摸不著頭腦。百度官方解釋是,它可以直觀宏觀地呈現人口遷徙情況,對于新聞報道、社科研究、全民科普等具有巨大價值,同時還可以輔助政府和企業更有效地決策,比如規劃線路等等。不過這些對于用戶而言感受并不直觀。今年百度遷徙一個變化就是更加關注,它可以給普通用戶帶來什么價值。
百度天眼整合航班信息,以可視化方式呈現不說,還可以查詢航班起降狀態、關注某個航班等翔實信息,在保證產品夠酷的同時具備實用性,等于說它做了航班管家在做的事情。常坐飛機的人一定會安裝航班管家或者航旅縱橫,足以說明航班信息對于航空旅行者的價值。百度車站和機場熱力圖對于用戶規劃出行、接送親友,都有參考價值。百度天眼呈現的實際是整個大數據從“噱頭”到“實用”這個變化。
2014年,百度成立專門的大數據實驗室,在大數據上動作頻頻,產品化、大眾化、開放化是幾個明顯的方向。一是預測業務,陸陸續續推出世界杯預測、票房預測、景點預測、高考預測諸多預測業務,并整合預測能力為百度大數據預測評測;二是LBS大數據,百度遷徙一炮走紅后,又陸續推出百度熱力圖、百度天眼等產品,其中熱力圖可以呈現商圈、景區的人口密度。三是整合能力到大數據引擎推出,讓前文提及的具備大數據但無挖掘能力的大中型企業和政府機構可以挖掘手里的數據。大數據成果背后是NLP(自然語言處理)、精準定位技術、大數據模型、深度學習以及GPU機器集群等底層技術在支撐。
顯而易見,百度大數據已經從實驗室走出來,變成產品、融入產品,走向大眾,同時開放給行業。大數據對于百度而言,并不是噱頭和炒作。已經成為其核心業務。整個行業對于大數據,也已從“看不懂不理不問、不看清跟風炒作”進入到“試著看跟進學習”這個階段。我們已經置身大數據世界,被大數據所影響,不論是你是否感知是否承認,你都在為大數據世界貢獻著數據和樣本,并受益于此。