日前,淘寶公布了人口遷徙數據,正是利用大數據技術的普及,普通人才能窺探出哪些城市是用工的熱門城市,同鄉都喜歡去哪些城市工作。實際上,隨著移動互聯網的普及,越來越多的人利用網絡購物、消費、娛樂……也正是每個人無處不在的網絡活動,構成了大數據,讓大數據得出的結論方便我們的生活。
最熱應用 互聯網公司推人口遷徙數據
伴隨著春運,人口遷徙圖成為今年春節最熱門的互聯網應用之一。在正月十五的前夕,淘寶網推出了人口遷移數據。
據淘寶網介紹,其中涉及的遷徙用戶中,85%的人是18-34歲的青壯年。雖然近年來“逃離北上廣”的聲音不絕于耳,但淘寶的數據顯示,北京、上海、廣州等大城市的人口依舊呈“正向”流入的趨勢。而去年遷徙人口位居首位的省份為廣東,說明廣東依然是對務工人員最有吸引力的地區。“這主要是因為珠三角是大規模勞動密集型產業地區,以及以往的‘路徑依賴’決定的。”北京大學中國社會與發展研究中心主任邱澤奇解釋了該數據。但同時難以忽略的是,流入北上廣一線大城市的人口增幅正在收窄,其中以北京為最。根據淘寶遷徙數據顯示,去年北京新增遷移人口比2012年少了三分之二。
來自淘寶的遷移數據還顯示,大部分地區的人選擇遷徙的目的地,都是離自己原所在地相對較近的地區。如安徽人最愛前往的地方是江蘇和浙江;河北人則更多遷往北京和天津;湖南、湖北、江西人,則選擇廣東作為“下一站”;寧夏人則選擇陜西的較多。
實際上,不僅是淘寶,此前百度在春運期間對網民開放了“百度遷徙”網頁,所有網民都可以訪問該專題頁面,通過可視化大數據的方式,了解全國春運的最新動態,包括全國春運最熱的線路,最熱門的遷出城市、遷入城市等。而阿里旗下的支付寶也利用大數據發布了《支付寶用戶春運報告》。
五花八門 互聯網應用暗藏大數據
除了上述人口遷徙利用了大數據外,其實在網民使用的各種網絡應用中,都會或多或少見到大數據的身影,像打車軟件、互聯網金融創新、網購消費等。
在手機打車市場,阿里巴巴的快的和騰訊的嘀嘀激戰正酣。“表面上看,阿里和騰訊搶的是打車軟件和移動支付市場,實際上,他們更大的目的在于大數據和O2O市場。”一位分析人士認為,通過這些軟件打車,司乘人員的信息都很透明,互聯網公司可以通過對用戶打車習慣、打車路徑等數據的積累、分析,疊加地圖服務、生活信息服務等內容,實現多重服務提供,增加客戶黏度,從而與商家以及消費者形成合作,實現贏利。
比如,某一位乘客經常打車到某一目的地,互聯網企業掌握這一數據后,可以在該用戶使用地圖軟件時,載入周邊的商場、餐館等信息,實現精準營銷。
而電商在銷售商品時也會用到大數據,除了根據用戶搜索數據推送相關商品外,還應用大數據推出適合消費者的產品。日前京東推出的“JDPhone”計劃,就是通過大數據挖掘用戶真實需求,深度整合產業鏈資源,為用戶打造最具性價比、超出期望的精品手機。
在去年“雙12”時,淘寶也曾運用大數據技術進行促銷。淘寶根據不同的人群需求,劃分出200多個購物場景。“場景購物”意味著消費者可以只憑著一個模糊的想法,甚至只是一個感覺,就能找到所需商品并一站購齊。
此外,在“雙12”時,淘寶在購物的各個環節為消費者提供購物預測。根據消費者在過去一年的消費特征,將所有紅包、秒殺商品經過個性化數據匹配后,推薦給用戶。
在互聯網金融方面,日前京東推出的“白條”業務,是消費者在京東購物消費時,享受“先消費、后付款”的延后付款或“分期0元購”的分期付款服務。“這一業務是通過對消費、金融和大數據的深入分析和理解,對用戶的消費記錄、配送信息、退貨信息、購物評價等數據進行風險評級,建立信用體系,為消費者提供的信用服務。”京東消費金融業務相關負責人表示。
技術揭秘 大數據是怎么來的
對于淘寶推出的人口遷徙數據,淘寶網有關負責人介紹,此次數據統計是根據用戶180天內,默認收貨地址信息的分析得出的。而百度相關人士介紹,百度遷徙是在“春運人口遷徙密集、中國手機滲透率高”的背景下,通過抓取分析手機網民定位信息的大數據,繪制出人群的遷徙軌跡。
“通俗地說是位置的變化,比如現在在這里使用手機,過了幾個小時以后,我們發現你在上海使用了手機。我們知道你的位置在這幾個小時的時間里發生了變化。”百度LBS(位置信息服務)技術總監顧維灝解釋春運數據的獲得。
據透露,支撐百度遷徙的LBS開放平臺聚集了超過40萬開發者,為數十萬款APP提供定位服務,覆蓋數億部手機,每天產生35億次的定位請求,每秒就有4萬次的定位請求。
與百度通過定位方式獲得大數據不同的是,支付寶方面的春運數據,則是基于支付寶的實名用戶,并利用大數據技術交叉分析得出。小微金服數據實驗室有關負責人表示,其是通過實名注冊用戶的出生地(通過身份證號碼前幾位來判斷)與現居地(比如常用收貨地址)之間的關系,并對比其他模型數據,從而描繪出在春運期間支付寶用戶的一些行為特征。
應用前景 大數據如何造福社會
對于網購大數據應用,消費者能感受到購物的便捷。而像人口遷徙等大數據的應用,是否只為滿足人們的好奇心,還是有其社會價值呢?
以百度遷徙為例,百度方面表示,百度遷徙是一個社會公益項目,百度期望這一項目能服務于政府部門的科學決策,賦予社會學等科學研究以新的觀察視角和方法工具。“北京市人口現在到底是什么狀態,通過以往的方法,我們很難準確研判。”有業內人士表示,“但大數據解讀就可以分析人口流動趨勢、交通擁堵情況等細節,為城市管理提供支撐平臺。”
人口遷徙的另一個價值是商圈分析。比如北京中關村的商圈,通過軌跡分析,可以看到一些購物中心人非常多,而一些購物中心的顧客流量并不是很大,這些數據可以幫助優化商圈,更好地配置資源。實際上,目前,阿里巴巴已經在利用大數據技術提供阿里信用貸款與淘寶數據魔方。騰訊則通過社交網絡數據挖掘打造全新營銷平臺,為廣告主實現精準營銷。百度建立了百度指數、司南、風云榜、數據研究中心、百度統計等五大數據體系平臺,提供企業實時數據服務。
目前在數據價值的發揮上,京東、天貓、易訊等電商已展開與第三方機構的合作,試圖通過對用戶各種數據分析,展示各自在網購市場上的優勢。但據業內人士透露,電商對供應商數據分享并未完全開放。
個人隱私 法規保護個人信息
數據越來越大,擔憂似乎也越來越多。在電子化時代,所有跟我們個人信息相關的數據,幾乎都流淌在網絡中。未來,也許一個節點的數據泄露,就是個人甚至周邊人的整個人生的信息曝光……
對于個人隱私問題,剛剛公布的即將于今年3月15日起實行的《網絡交易管理辦法》,就對保護消費者的個人信息做了規定。該辦法規定:網絡商品經營者、有關服務經營者在經營活動中收集、使用消費者或者經營者信息,應當遵循合法、正當、必要的原則,明示收集、使用信息的目的、方式和范圍,并經被收集者同意。網絡商品經營者、有關服務經營者收集、使用消費者或者經營者信息,應當公開其收集、使用規則,不得違反法律、法規的規定和雙方的約定收集、使用信息。
網絡商品經營者、有關服務經營者及其工作人員對收集的消費者個人信息或者經營者商業秘密的數據信息必須嚴格保密,不得泄露、出售或者非法向他人提供。網絡商品經營者、有關服務經營者應當采取技術措施和其他必要措施,確保信息安全,防止信息泄露、丟失。在發生或者可能發生信息泄露、丟失的情況時,應當立即采取補救措施。
新聞背景
什么是大數據
形象地說,以去年“雙11”為例,淘寶當日達成近兩億筆交易,總交易額達創紀錄的350余億元,這些交易記錄就形成了那天瘋狂網購的大數據。
IBM公司在其大數據網站首頁上說,最近兩年產生了人類社會誕生以來90%的數據量。
這些數據來自方方面面:傳感器采集的氣候信息、網站上的帖子、數字照片和視頻、購物交易記錄、手機GPS信號等。盡管尚無統一定義,但這些無比龐大的數據被稱為“大數據”。
我們在搜索引擎中每一次搜索的記錄、在電子商城中每一次的商品瀏覽和購買記錄、每一次電子支付的數據……這些看似不相干的龐雜數據,匯總在一起,經過分析提煉,一般即可描繪出這個人的行為習慣概況,并對未來可能采取的行為作出概率相當高的預測。
利用大數據技術,將上述眾多無頭緒的信息編織在一起,經過分析篩查,就能夠精確地指向潛在客戶,這也是大數據被商家們寄予厚望的原因所在。