近日,麻省理工科技報道稱,城市化快速擴(kuò)張,讓中國出現(xiàn)了許多空置率過高的“鬼城”。由于此前缺乏可靠的測量數(shù)據(jù),公眾難以了解“鬼城”問題的嚴(yán)重性。如今,百度研究院大數(shù)據(jù)實(shí)驗(yàn)室(Big Data Lab, Baidu Research)通過挖掘上億用戶的位置信息,判定城市是季節(jié)性的空城還是鬼城。(空城·計bdl.baidu.com/ghostcity)
研究人員通過分析每個用戶超過6個月時間的位置信息,并研發(fā)了聚類算法來計算這些用戶的家庭位置和工作位置,并以此計算出生活在每一個方圓100米范圍內(nèi)的人數(shù)。根據(jù)中國住房與城鄉(xiāng)建設(shè)部的規(guī)定,一個標(biāo)準(zhǔn)的城市地區(qū),一平方公里內(nèi)應(yīng)該容納10000人,而百度大數(shù)據(jù)實(shí)驗(yàn)室則將城市密度不足該數(shù)值的一半的城市定義為鬼城。此外,他們還會計算出特定區(qū)域內(nèi)的人口密度是否會因?yàn)榧竟?jié)推移而發(fā)生變化,從而判斷這一區(qū)域是旅游城市還是真正的鬼城。
該項(xiàng)目的負(fù)責(zé)人,來自百度大數(shù)據(jù)實(shí)驗(yàn)室的數(shù)據(jù)科學(xué)家吳海山博士,帶領(lǐng)其團(tuán)隊(duì)來自北京大學(xué)劉瑜教授實(shí)驗(yàn)室的實(shí)習(xí)生遲光華,首次使用定位數(shù)據(jù)來進(jìn)行精細(xì)的鬼城檢測。在提出這一算法之前,對于鬼城的判斷多數(shù)是基于不可靠的測量,比如在夜間進(jìn)行住宅建筑燈光的簡單計數(shù)。這種測量方法忽略了旅游業(yè)的季節(jié)性變化。許多城市或區(qū)域的人口密度與旅游息息相關(guān)。而此次百度提出的這一算法相比以往的估算更加有效,首先是基于百度地圖的用戶數(shù)據(jù)分析可以判斷出人流的方向、起點(diǎn)和終點(diǎn),從而更精確地了解到某個區(qū)域內(nèi)的常住人口。其次,這一算法還可以根據(jù)季節(jié)和旅游淡旺季區(qū)統(tǒng)計某個區(qū)域內(nèi)的人口變化,從而更科學(xué)地判斷特定區(qū)域的人口密度。該監(jiān)測方法將有助于當(dāng)?shù)卣谖磥碜龀龈玫囊?guī)劃決策,而非盲目的加大投入,造成資源浪費(fèi)。
百度大數(shù)據(jù)實(shí)驗(yàn)室BDL(Baidu Big DataLab)為百度研究院(Baidu Research)下設(shè)的三大實(shí)驗(yàn)室之一。該研究室主要從事大數(shù)據(jù)相關(guān)的研究工作,關(guān)注于大規(guī)模機(jī)器學(xué)習(xí),大數(shù)據(jù)的分析挖掘以及未來產(chǎn)品研發(fā)。目前,百度大數(shù)據(jù)實(shí)驗(yàn)室研發(fā)出了一系列針對商業(yè)和社會科學(xué)的解決方案。