百度遷徙春運項目揭秘
世界上最大的哺乳動物遷徙莫過于中國春運。每一年紅紅火火的春運即將結束,但是今年卻有些不同,百度推出的一項百度遷徙項目引起大家圍觀。大家對于百度遷徙也存在許多疑問,今天就在這里為大家解刨一下什么是百度遷徙,它又會給我們的生活帶來什么樣的變化。
在知乎的討論版上,我們看到了不少網友關于百度遷徙的討論,其中涉及了不少專有名詞,在討論百度遷徙之前,我們先為大家解釋一下這些常常見到的名詞都代表什么意思。
LBS
Location Based Service的縮寫,基于位置服務。意思就是這項服務內容是基于位置定位的。現在我們智能手機中LBS服務不少,比如打車服務、周邊團購信息查詢等,都是先確定了用戶的位置再提供相應的服務。
GPS
Global Positioning System,美國軍方開發的衛星定位系統,由衛星不斷發布精準的時間信息,通過終端產品計算確定用戶位置。其特點是覆蓋面廣、精度高(民用3-10米)、民用免費等特點。
粗略定位
粗定位有很多方式,我們比較常見的就是手機通過基站的粗定位,其原理與衛星定位差別不大,但是精度有限。比如在通訊基站較為密集的城市精度較好,在落后城市中基站較少就會出現很大的偏差。
API
Application Programming Interface縮寫,意為應用程序編程接口。我們使用的應用程序并非每一項服務都是有開發商一家完成的,有些服務需要調用其他公司的服務。說到百度遷徙則就意味著百度的LBS服務的API。對于中國嚴格限制地圖服務商的政策下,更多的應用開發商都需要選擇不同的位置服務商來調用數據。
手機定位
手機定位主要可以通過上面介紹的兩種方式,若要進行連貫導航,必須透過GPS連續定位獲取。而手機定位之后會在各種軟件、服務中留下“痕跡”,百度遷徙則是透過各種方式獲取了用戶的位置信息,通過大量的數據演算得來。
那么通過上面的一些名詞解釋,可能大家不難理解百度遷徙是從何而來。當然伴隨著手機定位的數據統計,也會讓用戶懷疑隱私是否安全等問題,那么下面我們就來看看百度遷徙的內容以及伴隨生活的定位服務會給我們帶來什么樣的優勢與隱患。
第2頁:遷徙數據從何而來?
首先百度遷徙的數據其實并非完全精準的,只是一個粗略定位數據的統計,“直線模式”就可以證明并非實時定位的數據,那么百度只需要調用春運路程的起點與終點數據既可以收集一個用戶的信息。原理有了,我們還需要大量的數據作為基礎。
看似非常復雜的遷徙圖 其實原理并不復雜 需要大量的數據做支撐
那么百度的數據是從何而來呢?去年3月份統計,國內移動通訊用戶達到了11.46億,而基于百度API的應用程序位置信息請求數量達到每日35億次(2013年8月數據),也就是說平均到每一個用戶,我們每天都會請求差不多3次位置數據,這樣龐大的數據量為百度遷徙提供了基礎。
如果是實時定位 回家的路線應該類似上圖 只取8小時兩點位置便形成下圖
在日常生活中,我們打開微信、微博甚至玩游戲都有可能請求位置數據,如果我們卸載了百度相關的應用之后其實也不能避免位置信息被收集,百度的LBS服務API已被數十萬應用采用,真的是“防不勝防”。
透過了如此大量的數據積累之后,百度遷徙中每一天都可以積累相當的位置信息。但是也有網友對于百度遷徙中8小時為單位的查詢表示疑問,8小時為一個循環的數據周期可能不夠準確。其實這并不重要,百度遷徙本身是大數據時代下的一個新面貌,而且在樣本數量足夠多的情況下,就足夠了。
動車大大縮短了出行時間 數據才選擇8小時為單位
而選擇8小時為單位,也是很合理的選擇,現在全國高鐵線路已經很成熟,使得每個人回家使用的時間大大縮短了,目前運行時間最長的高鐵動車組大概也就14個小時,大多都能夠在8小時內抵達目的地,乘坐飛機就更短了。如果在沒有高鐵或者飛機的時代,可能百度就會選擇24小時或者更長的時間作為遷徙樣本。當然百度也可以通過某些條件篩選合適的樣本,并非每一個人的8小時都需要被采用。
大數據是為了服務大眾
百度遷徙是大數據時代的一個具象表現,其實我們日常生活中還有各種各樣的數據被收集起來為各種公共事業服務,讓商家進行決策,但個人數據的采集一方面會給我們帶來很多便利,同時也存在一些隱患,我們一一來說說看。
路況信息的采集來源很多 TomTom的路況技術中就采用了手機定位的技術
LBS服務
位置信息對于用戶來說,可能主要是用來定位與導航相關服務;而對于商家來說,他們可以通過具體的位置,為我們提供更直接的服務。比如說我們要團購電影票,基于位置信息,我們可以得到距離由近及遠的影院排列,消費者更容易查詢。如果位置信息準確度不夠高,那么也可以根據所在城市來劃分,不會讓我們看到其它城市的影院信息,這些是毫無價值的。
公共事務&路況信息
而百度遷徙這個項目其實只是百度大數據的一部分,遷徙地圖可以讓我們看到一些有趣味的可視化大數據信息。而政府、廠商可以透過百度收集的位置信息大數據來做更多的事情。
比如說TomTom旗下知名的路況技術,其中有一部分就是透過手機定位的數據采集通過合理的演算方式,來得到路況信息以及預估未來路況變化情況的。而政府透過類似上班與下班市民集中的位置數據,對于城市規劃更具針對性,比如地鐵的線路應該如何規劃、商業區應該規劃在什么地方、公共部門(警局、醫院、辦事處)安置在什么地方。這些都是透過大數據來做決策的。
WiFi定位技術
而類似Google的WiFi定位技術,也是通過手機我們用戶手機的位置數據來填充數據庫的,因為每一個路由器的物理地址是固定的位置也不常變動,收集在數據庫中,任何接入Google服務器的用戶都可以透過WiFi的信號來確定自己的位置(這也是粗略定位的一種方式)。
第4頁:個人隱私也有泄密隱患
那么我們說了一些好處,也來談談位置信息泄露給我們帶來的隱患。任何技術從不同的側面來說都是雙刃劍,我們只是考慮利弊的比例來選擇是否采用。位置信息對于個人來說是一項隱私信息,其實在我們日常生活中也會帶來一些隱患,希望大家以后能夠有所注意。
內置GPS的相機可以直接標記地理位置
首先我們要說明,單獨的位置信息被收集起來,其實并不會對我們造成多大的困擾,因為我們家住在哪里或者在哪里工作,能對我們造成的損失還是有限的。而問題就在于搭配在位置信息一起我們泄露了什么。
許多軟件都會調用位置信息 如果不需要可以關閉 特別是照相機
以前有一個新聞,科普節目“流言終結者”主持人住家地址因為他用手機拍攝的圖片而泄露出去了,對他造成了不下的困擾。現在很多社交軟件以及拍照功能中都會請求位置信息,我們可以選擇關閉掉,這樣就可以避免一些明星的位置被泄露的問題。
對于普通消費者來說,如果我們發個微博,曬一曬家中的寶貝,一些高昂價格的物品加上你的家庭位置,如果泄露出去就很有可能被小偷盯上,而且不法分子很有可能會根據您拍攝的照片以及一些生活信息來進行詐騙活動。還是俗話說的好:“財不可露白”。在日常生活中多加注意,一方面少分享精準的位置信息,另一方面減少炫富的行為,都可以有效防范財產損失。
當然我們也不必太過擔心類似百度LBS收集起來的大數據,因為光是在這樣龐大的數據中分析出有價值的個人信息是很困難的,而且小偷小摸有這樣的能力自然也不會以身犯法,而且精確的大數據可以為我們生活提供不少的便利,對于城市的發展也意義非凡。