挑戰傳統出租車行業的打車軟件Uber,近來再次引起爭議。該軟件通過客戶的使用習慣和地理位置,標出了“一夜情多發地”。
這家租車中介公司一直以行事大膽而飽受爭議。這一次,這家美國企業招惹的不是出租車行業,而是他自己的客戶——這也出乎Uber自己的意料。
在一篇已經被刪除的博客上,Uber展示了他們充滿創新精神數據專家如何神通廣大。這篇博客中說:“我知道,我們不是你們生命中唯一的愛人,我們也知道,你們會在別的什么地方尋找愛情”,Uber以此證明,他們可以通過數據分析了解客戶的愛情生活。
波士頓很隨意,紐約客較拘謹
這家美國公司對自己的客戶數據進行了過濾,專門挑選那些在晚上10點到凌晨4點用車服務;同時這些客戶會在四到六小時之后,在距離上一次下車地點160米以內的地方再次叫車。Uber稱之為“榮耀之旅”——實際上就是所謂的一夜情。
根據這些數據,Uber推斷出那些發生一夜情的時間和地點,并將這些地點在紐約、舊金山以及其他美國城市的地圖上進行標注,分析出一夜情尤其頻繁的地區。由于互聯網永遠不會忘記,而且又有了Archive.org這樣專門記錄互聯網數據的網站,所以即便Uber官方很快就刪除了原文,我們仍能在網上看到這份“一夜情地圖”。
如果Uber的推斷靠譜,那波士頓恐怕就是美國一夜情圣地了。根據Uber的數據,有1%的Uber用車訂單符合這種在道德層面值得商榷的“榮耀之旅”模式。
而紐約人則顯得比較拘謹。“一夜情”的比率比波士頓低百分之八十。
一夜情最頻發的時間是周五和周六。
Uber德國總裁做出辯解
對于這份有爭議的分析報告,Uber德國總裁法比安·耐斯特曼(Fabien Nestmann)辯解,這份基于用戶數據的性行為報告只是一個“數據分析的小游戲”,并為Uber大范圍抓取用戶數據的行為辯護。
電視雜志《Panorama》在1月8日就此報道時打出的標題是“美麗新世界:分享的代價”,以此反思所謂的“共享經濟”(Sharing Economy)帶來的隱患。
耐斯特曼對《Panorama》的報道回應道:“我們可以通過整體評估做出決策,以改善服務。這是Uber必須且將來也要一直做的事情。”至于為什么將之前的博客內容刪除,他表示是應客戶的要求。將來Uber將集中精力做那些“更有意義的分析”。
(譯自《世界報》,Power by)
同樣類似的事情放在中國,似乎并沒有那么強烈的反彈。
接近一年前,2014年2月9日上午,央視報道了對東莞色情場所的暗訪節目,當晚,東莞全面清查全市娛樂場所。
東莞掃黃一時間在微博和微信上掀起討論高潮。一些人發微博說,有大量的東莞性工作者連夜離開東莞跑到香港去,可資佐證的是一張基于大數據的分析圖。
除夕夜和春運期間,央視《新聞聯播》曾引用百度遷徙的大數據,去年這次央視對東莞色情業的暗訪,再次讓百度遷徙的大數平臺瞬間火了一把。
點燃這把火的,是一張來自百度大數據平臺百度遷徙的數據截圖。圖片內容顯示,在2月9日23點之前的8小時內,百度遷徙平臺上顯示東莞人群遷移的主要城市名單。
來自新聞觀止的分析稱,在8個小時內,長途遷出東莞人口最多的城市排名分別是:香港、贛州、衡陽、寧波、梧州、漳州、上海、武漢、北京、青島。
很多人用“逃離東莞”作為調侃,來給這張圖配說明。在微博上,還有人說,百度遷徙的這張圖片表明,掃黃大掃帚把性工作者趕到香港等幾個城市。
這其實是一種誤讀。掃黃是從2月9日開始的,但在1月26日之前,大量人群從東莞遷移到北京、上海、武漢和青島等一線城市。
自1月26日開始,兩周期間,一直有大量人群從東莞遷移到香港、郴州、贛州、寧波和漳州等幾個城市。可見,不能單純的憑2月9日的百度遷徙圖,就得出有大量的性工作者“逃離”到香港、郴州、贛州、寧波和漳州。
擁有八百多萬人口的東莞,它8小時的人口流動,跟色情行業的關聯度其實并沒有那么高。越臨近春節,從東莞遷移到周邊省份二三線城市的人越多。這跟東莞的整個經濟結構是有關的——東莞大量的制造業,勞動力來自江西、湖南和湖北等周邊省份的農民工,這些農民工需要返鄉,過完春節再回東莞。每年都像候鳥一樣遷徙。
這里再解釋一下百度遷徙,百度地圖春節人口遷徙大數據(簡稱百度遷徙)是百度在2014年春運期間推出的一項技術項目。百度遷徙利用大數據,對其擁有的LBS大數據進行計算分析,采用的可視化呈現方式,動態、即時、直觀地展現中國春節前后人口大遷徙的軌跡與特征。
百度遷徙本來的意義是為了記錄和呈現春運人口遷徙狀況,卻歪打正著遇上了CCTV東莞事件,因而被解讀成了“嫖客跑路示意圖”。
從上述時間點孤立地看,上述結論當然可以成立,但是從CCTV曝光之前的東莞春節人口遷徙來看,東莞相對平靜的初六和風波驟起的初十遷徙數據沒有什么大的區別。
反倒需要注意的是,百度遷徙的數據來源是來自百度地圖,而千萬上億級別的手機位置數據則被百度掌握,你我他可能都是這以大數據項目的貢獻者,不管你是否自愿。這個移動互聯網時代,聯網,或許意味著被跟蹤著。
百度這款基于大數據的遷徙圖產品所使用的數據是批量化、去中心化的數據,呈現的是群體性運動趨勢而不是個體行為。LBS領域專家認為,此次東莞事件引發對百度地圖的誤讀,其實源于大眾對大數據技術的不了解所,大數據與用戶隱私數據完全是兩個概念。
從技術層面上來說,百度遷徙涉及到的定位數據并非直接來源于用戶,而是來源于采用百度地圖LBS定位服務的數十萬個APP應用。這些APP應用由數萬開發者提供,也就是說,百度遷徙使用的相關數據都是批量化、去身份化的數據,不會與人的真實身份相對應;其次從百度遷徙的產品特征上來說,百度遷徙關注的是群體性趨勢,而不是個體行為,因此在用戶使用過程中并不會涉及公眾的個人隱私問題。