長夜漫漫,無心睡眠,我以為只有我睡不著,原來晶晶姑娘你也睡不著!請問你也是春運沒買到坐票嗎?每年的這個時候,總會流傳著一張圖片,那就是非洲的角馬大遷徙和春運盛況的對比圖,隱含的意思無非就是說“雨季又過了,又到了春運的季節,男男女女們擠在一起,隨著列車輕輕的搖動,就如同那雄海龜趴在雌海龜的身上……”
所以當百度推出的春運遷徙地圖在央視亮相的時候,馬上讓我眼前一亮。作為這種大數據可視化產品的腦殘粉,一定要跳出來贊一下。
一.遷徙地圖背后的大數據可視化
從全國遷徙圖首頁可以看出,數據來源是百度地圖LBS開放平臺,并且輾轉找到此項目的負責人求證后,也驗證了這一產品的數據來自于眾多使用了百度地圖的應用所傳送來的定位請求,從而對所有請求信息進行辨認設備和定位位置變化來分析處理全樣數據。上面的話比較拗口,簡單點兒說,就是只要你的手機里裝有使用百度地圖API的應用,那么你的長距離移動就是這張地圖里的一條線。只拿此刻的數據進行一下解讀,1月26日上午十點,在過去八小時內最熱的遷入城市前三名是北京重慶和贛州。無論重慶和贛州,都是勞務輸出的重點地區,排名前三理所應當。那么北京為什么位居遷入城市第一?點開北京的路線詳情就能看到,遷入北京的大部分是廊坊、天津、葫蘆島等地的人,只是把北京當做一個交通中轉站而已。這也就是北京能在遷出城市和遷入城市都能名列第一的原因了。已經看到有人質疑這種產品有什么作用。在我看來,再牛逼的大數據挖掘技術,如果不能以一個接地氣的方式表達出來,那么永遠就只能停留在拙劣的公關PR稿中。舉一個最淺顯的例子,如果鐵道部看完這個圖,那么他們至少知道下一步的高鐵線路應該怎么鋪設。如果你是那個在火車上賣WIFI的小哥,你肯定也會選擇最熱線路吧?賣燒不壞的襪子、越南跌打膏之類的朋友們同理。前兩天,陌陌也推出了他們春運版的數據,盤點了熱門回家線路熱門群組各種數據。但是看完之后,我陷入了深深的失望,我最盼望的數據是“漂亮妹子最多的線路”“漂亮妹子最多的車廂”“D杯以上無座只好站著的漂亮妹子最多的車次”……
二.稱贊與吐槽
一直以來,百度是我心目中人格最分裂的公司,A面是一個善于營銷和自我推廣的公司,但是最近幾年推出的新產品基本都是跟隨型產品,別人先蹚出一條血路,然后百度再用自己龐大的用戶群和流量去拓寬這條路,包括踩死先行者。B面是一個擁有著眾多牛人和牛逼數據的GEEK,但是卻不拿這些數據來做一些讓人拍案叫絕的東西。
如果想成為谷歌一樣受到全世界尊重的搜索公司,那么百度必須要做一些讓人驚嘆的產品。例如2008年前,谷歌推出了一個單獨的小產品--流感疫情地圖,里面將從世界各國衛生組織收集到的流感信息用可視化的方式呈現出來,這樣你在出差的時候,就知道是否應該帶藥品了。(嗯,根據地圖顯示,我國人民身體素質很好,身體倍棒吃嘛嘛香不得感冒)。
從表面上看,這產品對谷歌商業化產品沒有任何拉動作用,但是經過這樣的嘗試,在兩年后,當H1N1病毒肆虐的時候,谷歌已經能將患病高發區整合進自己的地圖應用了。百度遷徙地圖算是百度近年來比較少見的,不以拉動任何產品下載使用為目的的數據產品了。但是就產品細節來說,有不少地方有待改進,例如視覺的炫酷感,例如地圖的可點擊操作等等。
無獨有偶,就在五天前,英國《衛報》推出了他們的一個數據產品,叫做《在天上--航空的百年史》。因為1914年是世界上首個商業航班試飛成功,當時只有1名乘客。1914年全年也只賣了1205張票,而2013年賣了31億2千萬張飛機票。產品首頁就實時展示了現在全世界上空正在飛行的飛機數和過去24小時所飛過的航線圖,很炫很酷,并且密集恐懼癥患者慎入。(地址,可能需要翻一下~)
三.大數據需要更接地氣
大數據,要玩起來,才會更好玩。我們經常會在公關PR稿中看到這樣的話“在本次發布會上推出的新版本,是基于大數據,由業內資深的大數據挖掘團隊和機器學習團隊埋頭研究數月才推出的……”讓人不明覺厲。同樣的句式,放之四海而皆準,例如情趣用品,也可以說“我們這次推出的新的按摩棒,是基于大數據,由業內資深大數據挖掘團隊和機器學習團隊埋頭研究數月才推出,完全符合絕大多數中國女性的使用習慣……”所以,大數據現在需要的是將一個泛概念變成一個個接地氣的產品或者項目。例如美國梅西百貨,他們會根據庫存和需求變化情況,實時的調整7300萬種商品的實時定價。例如洛杉磯警局,會根據各個區域之前的犯罪率和居住情況,預測性的調整巡邏頻率和力度。百度遷徙地圖,如今只是剛上線,所以更多起到的是公關和宣傳的作用。而如果這個產品能堅持10年,那么這一定是了解中國產業結構變化和人群生態變化的最簡單的途徑。打住,寫到這里,突然覺得上面的文字正經到了可怕的地步。