精品国产一级在线观看,国产成人综合久久精品亚洲,免费一级欧美大片在线观看

當(dāng)前位置:大數(shù)據(jù)業(yè)界動態(tài) → 正文

基于移動定位大數(shù)據(jù)的城市空間研究進(jìn)展

責(zé)任編輯:editor007 作者:丁亮 鈕心毅 宋小冬 |來源:企業(yè)網(wǎng)D1Net  2015-11-19 17:39:21 本文摘自:199IT網(wǎng)

326326032

通過文獻(xiàn)梳理,發(fā)現(xiàn)大數(shù)據(jù)為空間研究提供了豐富的樣本,但當(dāng)前的數(shù)據(jù)存在非全樣本、缺少社會經(jīng)濟(jì)屬性、非隨機缺失的缺陷。大數(shù)據(jù)研究的廣度和深度正在不斷擴展,呈現(xiàn)出多學(xué)科參與的特點,但研究結(jié)論還缺少新的理論探索和解決實際問題的應(yīng)用。據(jù)此提出當(dāng)前的大數(shù)據(jù)只是傳統(tǒng)數(shù)據(jù)的有益補充,適用于描述、分析空間現(xiàn)象和規(guī)律,適宜于兩方面研究:驗證理論模型、提出研究問題;分析空間現(xiàn)狀、評估空間規(guī)劃。這兩方面研究可通過統(tǒng)計匯總和空間計算的方法實現(xiàn)。

關(guān)鍵詞:移動定位,大數(shù)據(jù),城市空間研究,城市規(guī)劃

近年來隨著移動定位服務(wù)和云處理技術(shù)的發(fā)展,搜集和處理個人定位信息已成為現(xiàn)實。由移動定位數(shù)據(jù)組成的海量數(shù)據(jù)(大數(shù)據(jù))庫打破了傳統(tǒng)的資料搜集方式,推動了城市空間研究的發(fā)展。諸多學(xué)者利用當(dāng)前可獲取的移動定位大數(shù)據(jù)(本文中的大數(shù)據(jù)均指移動定位大數(shù)據(jù),包括手機數(shù)據(jù)、公交刷卡數(shù)據(jù)、GPS 數(shù)據(jù)、社交網(wǎng)站簽到數(shù)據(jù)等)開展了城市空間研究,取得了較豐富的成果。當(dāng)前已有國內(nèi)學(xué)者對這些研究成果做了介紹,如秦蕭等從城市等級體系、交通、功能區(qū)、特征與活動、社交關(guān)系、重大事件等方面介紹了大數(shù)據(jù)在城市空間研究中的最新進(jìn)展,提出了基于大數(shù)據(jù)的城市空間研究體系[1]。葉宇等從實體空間、社會空間兩方面介紹了大數(shù)據(jù)在城市空間研究中的成果,提出大數(shù)據(jù)時代城市規(guī)劃在數(shù)據(jù)搜集、響應(yīng)速度、編制方式、決策輔助、編制策略、關(guān)注要點、實施過程、評價力度等方面面臨革新[2]。冉斌等提出了手機定位數(shù)據(jù)在不同層面城市規(guī)劃中的應(yīng)用方向,并論述了職住人口空間分布、OD 客流分布、城市間客流聯(lián)系等方面的應(yīng)用實例[3]。任頤等用無錫手機數(shù)據(jù)探索了通勤人口分布、居民出行OD、重點區(qū)域人口集散特征等方面的應(yīng)用[4]。

這些論文重在對已有研究和應(yīng)用成果做較系統(tǒng)的歸納整理,有的還構(gòu)建了基于大數(shù)據(jù)的城市研究框架,對于近年來熱議的“大數(shù)據(jù)時代城市規(guī)劃如何應(yīng)對機遇與挑戰(zhàn)”提供了借鑒。但筆者認(rèn)為城市規(guī)劃作為一門實踐性較強的學(xué)科,在使用數(shù)據(jù)時必須根據(jù)數(shù)據(jù)的特點加以不同方式的利用,方能使數(shù)據(jù)真實反映城市現(xiàn)狀問題,為規(guī)劃設(shè)計提供幫助。因此,還有必要對大數(shù)據(jù)及其研究特征作一個較深入的分析,包括大數(shù)據(jù)與傳統(tǒng)數(shù)據(jù)相比有何優(yōu)勢和缺陷,當(dāng)前大數(shù)據(jù)研究中遇到哪些局限等問題。本文選取了收錄在Web of Science 上的聚焦城市規(guī)劃的對象--空間的文獻(xiàn)進(jìn)行分析,以期能從這些文獻(xiàn)中解答上述問題,梳理出大數(shù)據(jù)在城市規(guī)劃中適宜的研究。

一、基于大數(shù)據(jù)的城市空間研究類型

艾斯(Ahas)等是較早提出可用手機的移動定位數(shù)據(jù)進(jìn)行城市空間研究的學(xué)者。2005 年他提出基于手機的社會定位方法(Social Positioning Method)能監(jiān)測人口總量和移動軌跡、預(yù)測和防止由人流集聚產(chǎn)生的問題,這一方法會在不久的將來獲得廣泛應(yīng)用,并從根本上改變公共生活和公共管理[5],但文中并未闡述具體的研究成果。隨后,拉蒂(Ratti)等于2006 年以熱點圖的方式展現(xiàn)了用手機數(shù)據(jù)分析城市活動時空變化的研究成果。提出“隨著新技術(shù)的發(fā)展,人們的生活和工作習(xí)慣正在發(fā)生變化,活動變得更加靈活,城市的動態(tài)性正在變得更加復(fù)雜,需要新的方法和數(shù)據(jù)來分析城市”。拉蒂在文中還提出了“移動景觀”(MobileLandscapes)的概念,來回答如何記錄OD、如何理解個體移動以及城市形態(tài)和流之間是什么關(guān)系,認(rèn)為移動景觀能反映時實移動圖,而不需要再借助傳統(tǒng)模型。并將米蘭20 km×20 km 空間范圍內(nèi)2004 年4 月19 日-5 月4 日的移動通話時長數(shù)據(jù)匯總為人流密度,可視化反映人流活動分別在白天、晚上以及工作日、周末、重大活動日等不同時間段的變化[6]。這一研究開啟了應(yīng)用移動定位數(shù)據(jù)大范圍、大樣本、動態(tài)認(rèn)識城市系統(tǒng)的研究領(lǐng)域:通過數(shù)據(jù)的統(tǒng)計匯總,認(rèn)為城市空間活動雖然由無數(shù)個體的無序活動組成,但在整體層面有規(guī)律可循,可以用移動定位數(shù)據(jù)來反映城市活動的時空變化。

此后便有學(xué)者在拉蒂的研究基礎(chǔ)上,用手機數(shù)據(jù)、公交刷卡數(shù)據(jù)、GPS 數(shù)據(jù)、社交網(wǎng)站簽到數(shù)據(jù)等移動定位大數(shù)據(jù)探索城市空間研究,并將研究由描述空間的表面現(xiàn)象、識別空間功能深入到驗證傳統(tǒng)理論模型、分析空間聯(lián)系測度中心體系。

(一)空間現(xiàn)象描述

拉蒂的研究對用移動定位大數(shù)據(jù)開展城市空間研究已經(jīng)產(chǎn)生了較大影響,至2015 年1 月已在Web of Science 上有117 次被引,是同類論文中最多的。受拉蒂的影響,諸多學(xué)者開展了類似的研究。例如,維埃拉(Vieira)等用手機通話、短信數(shù)據(jù)表征人流密度變化,發(fā)現(xiàn)中心區(qū)工作日早上密度最高,下午密度下降,晚上商業(yè)、商務(wù)區(qū)和地鐵線周圍密度最高,郊區(qū)周末早上和下午密度最高等現(xiàn)象[7]。塞夫塞克(Sevtsuk)等利用羅馬398 個基站的手機通話時長數(shù)據(jù)研究日?;顒拥囊?guī)律,發(fā)現(xiàn)通話時長可以分為24 小時(即每天的活動是有規(guī)律的)、3.5 天(即工作日和周末的規(guī)律是不同的)、12 小時(表示晝夜的活動規(guī)律)和8 小時(表示工作時間、非工作時間的活動規(guī)律)的周期,大多數(shù)活動都有規(guī)律可循,不同地區(qū)的活動受人口、設(shè)施、環(huán)境等因素影響[8]??巳鹚圭辏↘risp)用赫爾辛基的手機數(shù)據(jù)研究人流密度時實分布情況作為消防和安全設(shè)施布局的依據(jù)[9]。貝克爾(Becker)等利用手機通話和短信數(shù)據(jù)研究莫里斯敦(Morristown)工作、娛樂人群的居住地分布,發(fā)現(xiàn)莫里斯敦對周邊地區(qū)就業(yè)活動的吸引力大于娛樂活動的吸引力,作者還利用通話和短信記錄區(qū)分人群,發(fā)現(xiàn)工作時間比非工作時間使用短信多的人群的空間分布范圍更大[10]。塞戈(Sagl)等用烏迪內(nèi)(Udine)的手機握手?jǐn)?shù)據(jù)、通話時長數(shù)據(jù)和Flicker 社交網(wǎng)站簽到數(shù)據(jù)分析城市不同時段的活動強度。由手機數(shù)據(jù)發(fā)現(xiàn)西部地區(qū)與中心區(qū)的聯(lián)系比東部地區(qū)與中心區(qū)的聯(lián)系強,西北地區(qū)的通信呈現(xiàn)雙峰特征;由社交網(wǎng)站簽到數(shù)據(jù)發(fā)現(xiàn)不同地點的活動特征受季節(jié)影響[11]。隨后又用手機通話、短信數(shù)據(jù),通過可視化分析方法研究烏迪內(nèi)工作日和周末空間活動的時實變化[12]。曼弗雷迪尼(Manfredini)等利用2009 年和2010 年蒙扎(Monza)和布里安扎(Brianza)的手機通話時長、短信、移動交換中心活躍用戶數(shù)據(jù)研究城市動態(tài)活動,提出可以用手機數(shù)據(jù)描述城市空間以小時、天、周為單位的使用強度變化,以此為依據(jù)制定城市政策、計算人口密度、時實監(jiān)測本地和外來人口[13]。約翰(John)等用手機數(shù)據(jù)模擬愛爾蘭區(qū)域性人口流動,結(jié)合馬爾科夫鏈分析人口密度分布,這一研究結(jié)果與中央統(tǒng)計局的人口普查數(shù)據(jù)高度一致[14]。上述研究中使用的手機數(shù)據(jù)有通話時長、通話頻次、短信量、握手?jǐn)?shù)據(jù)等,用來表征城市空間活動強度的統(tǒng)計口徑并不統(tǒng)一。因此,康朝貴等對研究中用通話時長、通話頻次、手機用戶數(shù)能否表示真實的人流活動提出了質(zhì)疑,通過研究3 個數(shù)據(jù)與2008 年全球人口動態(tài)統(tǒng)計分析數(shù)據(jù)(LandScan)的關(guān)系發(fā)現(xiàn),通話時長和通話頻次的關(guān)系隨時間變化,通話頻次與手機用戶數(shù)呈線性相關(guān),手機用戶數(shù)和真實人口數(shù)量的比例在不同地區(qū)是不同的,不能用來表示真實的人口數(shù)量,因此,通話活動能反映活動強度但不能代表人口分布[15]。

空間現(xiàn)象描述利用大數(shù)據(jù)大樣本、高頻率的優(yōu)點,用簡單的統(tǒng)計匯總、可視化表達(dá)就能實現(xiàn)傳統(tǒng)調(diào)查方法難以開展的研究。但是,研究結(jié)論只是一般現(xiàn)象的描述,并未深入分析、挖掘現(xiàn)象背后的規(guī)律。

(二)空間功能識別

部分學(xué)者在用大數(shù)據(jù)描述空間現(xiàn)象的基礎(chǔ)上通過空間計算,根據(jù)空間使用特征識別其主導(dǎo)功能,包括識別不同的功能區(qū)、土地使用類型等。例如,瑞茲(Reades)等將羅馬47 km2 劃分為1 600 m2 為單位的柵格,計算每個柵格的平均通話時長并進(jìn)行標(biāo)準(zhǔn)化處理,并用聚類分析分離出8 類地區(qū),識別羅馬中心城區(qū)邊界[16]。此后又用特征分解法(EigendeComposition)識別和提取羅馬100 萬手機用戶的通話時長數(shù)據(jù),以柵格數(shù)據(jù)反映日間熱點地區(qū),發(fā)現(xiàn)與用企業(yè)黃頁數(shù)據(jù)得到的商業(yè)密度分布非常契合。研究結(jié)果證實了可用手機數(shù)據(jù)來進(jìn)行空間計算和比較分析[17]。齊觀德(Guande)等利用杭州300 萬條出租車GPS 數(shù)據(jù),分析載客量與城市社會功能區(qū)的關(guān)系。發(fā)現(xiàn)載客量與社會活動強度有關(guān),不同地區(qū)的載客量不同。作者用聚類法識別不同的社會功能區(qū),準(zhǔn)確率達(dá)到了97.44%[18]。劉瑜等分析了上海6 600 輛出租車的GPS 數(shù)據(jù)。發(fā)現(xiàn)載客量呈現(xiàn)以24 小時為周期的變化規(guī)律,市中心、居住區(qū)、虹橋機場、浦東機場、郊區(qū)5 個點的載客量具有不同的時間序列。進(jìn)而利用普利亞姆(Pulliam)提出的“源-庫”(Source-Sink)模型,通過計算上下客人次的差值聚類來分析土地利用現(xiàn)狀,研究結(jié)果與2007 年的土地使用情況一致性高達(dá)78.5%[19]。裴韜等通過新加坡的手機通話數(shù)據(jù)的聚類分析表征不同的用地類型,準(zhǔn)確率達(dá)到了58.03%,并且發(fā)現(xiàn)用地異質(zhì)性越高準(zhǔn)確率越低,手機基站數(shù)量越多準(zhǔn)確率越高[20]。

空間功能識別解答了用大數(shù)據(jù)描述空間現(xiàn)象是否準(zhǔn)確的疑問。將大數(shù)據(jù)識別的空間功能和普查、統(tǒng)計數(shù)據(jù)進(jìn)行比較,證明了大數(shù)據(jù)有可能較準(zhǔn)確地反映空間和土地使用,可為開展后續(xù)研究提供支撐。但該類研究本身與城市規(guī)劃關(guān)系并不密切,只是開展后續(xù)規(guī)劃研究的基礎(chǔ)。

(三)理論模型驗證

隨著大數(shù)據(jù)研究的廣泛開展,空間現(xiàn)象描述和空間功能識別已經(jīng)較為成熟,但其局限性也日益顯現(xiàn),即對研究的實際貢獻(xiàn)較小,只是數(shù)據(jù)可視化展示和可信性證明。因此,有研究者開始探索大數(shù)據(jù)在驗證距離衰減效應(yīng)、重力模型等理論模型研究中的作用。例如,拉蒂等將英國12 萬個居民和商戶的固定電話時長數(shù)據(jù)賦值到3 042 個柵格中,分析不同地區(qū)的聯(lián)系程度。在兩次迭代后分離出了23 個地區(qū),與行政邊界高度一致,證明了行政邊界不僅影響人口空間分布,還影響通訊交流[21]??ɡ祭兹–alabrese)等用聚類分析研究手機用戶的動態(tài)OD 矩陣,發(fā)現(xiàn)手機數(shù)據(jù)和普查數(shù)據(jù)在縣級層面(county level)的交通流、工作日早交通、重力模型的標(biāo)準(zhǔn)差的擬合度分別達(dá)到了0.73、0.76、0.59,但在普查區(qū)層面(census-tract levels)僅有不到0.3、0.36、0.1。作者認(rèn)為這是由于普查區(qū)層面的樣本量較少、統(tǒng)計時間不一致引起的[22]??党F等通過研究439 萬手機用戶的通話數(shù)據(jù)發(fā)現(xiàn)城市間的通話量不但存在距離衰減效應(yīng),還存在位序分布[23]。高松等做了相似研究,發(fā)現(xiàn)哈爾濱90% 的通話距離在20 km 之內(nèi),通話量的距離衰減參數(shù)(1.45)與空間距離衰減參數(shù)(1.60)相似,反映了網(wǎng)絡(luò)空間的距離限制略小于物理空間[24]??ɡ祭兹扔民R塞諸塞州的手機數(shù)據(jù)研究出行距離的影響因素,發(fā)現(xiàn)公共交通越便捷,公眾會越傾向于使用公共交通從而增加出行距離[25]。

理論模型驗證是大數(shù)據(jù)理論研究價值的有益探索。大數(shù)據(jù)不再僅是“炫耀”數(shù)據(jù)可視化及分析技術(shù)的工具,開始吸引關(guān)注理論模型研究的專業(yè)學(xué)者。但當(dāng)前的理論研究還只是對傳統(tǒng)理論的驗證,用大數(shù)據(jù)探索新理論尚有較大難度。

(四)中心體系分析

還有學(xué)者通過空間計算對空間現(xiàn)象開展了更為深入的研究,主要致力于定量分析城市中心體系,通過測度人流量及其空間聯(lián)系識別城市中心、分析中心職能。例如,劉亮等用深圳5 000 個出租車GPS 數(shù)據(jù)和500 萬個公交和地鐵IC 卡數(shù)據(jù),建立了一個時實的城市動態(tài)集成圖(Integrated UrbanMobility Patterns)來認(rèn)知城市、優(yōu)化城市動態(tài)分析方法。作者通過研究地鐵站進(jìn)出人流量發(fā)現(xiàn)世界之窗、崗廈站是居住中心,國貿(mào)、大劇院、華強路、購物公園、車公廟站是工作中心,老街和華強路是購物和娛樂中心。工作日早高峰呈現(xiàn)以世界之窗和崗廈站為中心的由西向東的單向流特征,晚高峰呈現(xiàn)以華強路和大劇院站為中心的由東向西的單向流特征,鐘擺交通量周六大于周日大于工作日。作者又通過分析出租車OD 數(shù)據(jù)發(fā)現(xiàn)羅湖、福田、南山3 個重要的經(jīng)濟(jì)發(fā)展區(qū)聯(lián)系最緊密[26]。羅斯(Roth)等提出世界城市有復(fù)雜的空間結(jié)構(gòu),人口、密度、區(qū)位已經(jīng)發(fā)生了巨大變化,不能用簡單的單中心城市結(jié)構(gòu)來解釋。作者將倫敦203 萬人1 122 萬條地鐵刷卡數(shù)據(jù)在空間上以1 500 m 為半徑進(jìn)行聚類分析,發(fā)現(xiàn)人流向多個中心集聚,證明倫敦是多中心結(jié)構(gòu)的大城市[27]。劉瑜等將上海以人民廣場為圓心的13 km 半徑范圍分為每2 km 為間隔的同心圓,通過每個圈層中出租車上下客人次的差值聚類識別用地功能,發(fā)現(xiàn)由中心至外圍商業(yè)、娛樂用地減少,工業(yè)用地增加,證明了上海呈單中心結(jié)構(gòu)[19]。鐘晨等使用新加坡的公交刷卡數(shù)據(jù)用空間插值(SpatialInterpolation)和匯總統(tǒng)計(Summary Statistics)的方法分析新加坡空間結(jié)構(gòu)的變化。研究發(fā)現(xiàn)隨著公交和地鐵系統(tǒng)的完善,出行距離和客流量都在增長,反映了城市的聯(lián)系強度在加強。因地鐵促進(jìn)了長距離交通,較高中心度的地區(qū)逐漸增加,有地鐵站點的城市樞紐的功能集聚度增強。增長的公共交通客流量主要集中在副中心所服務(wù)的新建社區(qū),證明新加坡正在向多中心城市結(jié)構(gòu)轉(zhuǎn)變[28]。

中心體系分析不同于空間現(xiàn)象描述,多由專業(yè)學(xué)者以研究問題為目標(biāo),借助空間分析方法,應(yīng)用專業(yè)知識分析數(shù)據(jù)、解讀結(jié)果。這類研究與城市規(guī)劃中的空間結(jié)構(gòu)規(guī)劃有密切關(guān)系,識別城市中心、分析中心職能的方法已經(jīng)能用于評估公共中心規(guī)劃的實施效果,展現(xiàn)出了一定的應(yīng)用前景。

二、大數(shù)據(jù)在城市空間研究中的思考

由上述文獻(xiàn)可知,近年來大數(shù)據(jù)研究的關(guān)注度和成果數(shù)量呈上升趨勢?!冻鞘锌萍茧s志》(Journal of UrbanTechnology)2010 年第1 期開設(shè)了地理和規(guī)劃中的移動定位和追蹤(Mobile Positioning and Tracking in Geography andPlanning)???,2014 年第2 期又一次開設(shè)了移動通信和城市空間(Mobility,Communication,and Urban Space)專刊。這與當(dāng)前城市空間活動過于復(fù)雜有密切關(guān)系,需要借助大數(shù)據(jù)分析城市中的各種流(Flow)來認(rèn)識由人流、物流、信息流構(gòu)成的網(wǎng)絡(luò)(Network),了解城市要素內(nèi)和要素間的相互作用和關(guān)系,認(rèn)識城市空間的發(fā)展規(guī)律[29] 有密切關(guān)系。但大數(shù)據(jù)在受到熱捧的同時,還需要理性看待,因為大數(shù)據(jù)并非萬能,其研究可能會遇到諸多局限,例如,康朝貴等對通話時長、通話頻次、手機用戶數(shù)能否表示真實的人流活動的質(zhì)疑[15] 值得引起重視?;谏鲜鑫墨I(xiàn),筆者認(rèn)為當(dāng)前大數(shù)據(jù)及其研究存在以下特征。

(一)大數(shù)據(jù)的優(yōu)勢和缺陷

大數(shù)據(jù)的一大特征就是海量數(shù)據(jù),提供個體時實移動軌跡數(shù)據(jù)。從文獻(xiàn)中可知出租車GPS 數(shù)據(jù)的樣本量和記錄量分別約為103 / 天和105/ 天,公交刷卡數(shù)據(jù)為106/ 天和107/ 天,手機數(shù)據(jù)更是高達(dá)107/ 天和108/ 天(不同城市可能會有所差別),遠(yuǎn)遠(yuǎn)超出了傳統(tǒng)調(diào)查方法能夠獲取的數(shù)據(jù)量。從數(shù)據(jù)內(nèi)容來看,雖然數(shù)據(jù)產(chǎn)生和存儲不是以空間研究為目的(例如,手機數(shù)據(jù)是通信商為了解基站負(fù)荷,以便及時增減基站而存儲),但數(shù)據(jù)中包含的“誰-什么時候-在什么地方”的信息與城市空間研究所需的樣本空間數(shù)據(jù)基本一致,為定量分析提供了充足的樣本。

但大數(shù)據(jù)也有缺陷。首先,“大數(shù)據(jù)就是全樣本”[30] 只是在理論上成立,公交刷卡數(shù)據(jù)、GPS 數(shù)據(jù)、手機數(shù)據(jù)等都只記錄了特定人群的時空軌跡(例如,公交刷卡數(shù)據(jù)只記錄了使用公交卡的用戶的數(shù)據(jù)),這種抽樣是非隨機的,是否能準(zhǔn)確代表總體時空軌跡特征存在質(zhì)疑[25]。其次,數(shù)據(jù)內(nèi)容單一,僅有空間信息,不包含樣本的年齡、收入、職業(yè)等社會經(jīng)濟(jì)信息[25],只能通過數(shù)據(jù)反映空間的現(xiàn)象和規(guī)律,而難以解釋其背后的社會經(jīng)濟(jì)原因。在這種情況下,研究者只能以一般行為規(guī)律為依據(jù),識別行為目的,以試圖挖掘數(shù)據(jù)隱藏的信息。但根據(jù)龍瀛等的研究,從公交刷卡數(shù)據(jù)中能同時識別居住和工作地的用戶僅占總用戶的2.8%[31] ;根據(jù)艾斯的研究,從手機數(shù)據(jù)中能同時識別居住和工作地的用戶僅占總用戶的44.5%[32]。大數(shù)據(jù)一旦進(jìn)行識別處理,其以全樣本保證抽樣隨機性的優(yōu)勢就不復(fù)存在,識別結(jié)果很有可能會與總體產(chǎn)生偏差,在如此大樣本情況下這種偏差尚缺少科學(xué)方法校準(zhǔn),總量和空間上偏差多少也難以給出確切數(shù)據(jù)。若用識別數(shù)據(jù)進(jìn)行下一步研究很有可能會產(chǎn)生“精確的錯誤”。最后是數(shù)據(jù)質(zhì)量問題,上文綜述的文獻(xiàn)中雖未提到這一問題,但筆者在研究實踐中[33] 發(fā)現(xiàn)大數(shù)據(jù)并非如邁爾· 舍恩伯格(Mayer-Schonberger)等所說可以“允許不精確”[30]。“允許不精確”需要隨機錯誤這一前提,然而從筆者獲得的數(shù)據(jù)來看,由于數(shù)據(jù)記錄和存儲等問題,數(shù)據(jù)存在非隨機缺失,有的表現(xiàn)為空間缺失,有的表現(xiàn)為記錄缺失。從當(dāng)前的研究成果來看尚缺少驗證數(shù)據(jù)質(zhì)量、提高數(shù)據(jù)應(yīng)用可靠性的方法。

(二)大數(shù)據(jù)研究的局限

從已發(fā)表的文獻(xiàn)來看,大數(shù)據(jù)并未被研究者過度追捧。很多研究者認(rèn)為大數(shù)據(jù)只是提供了過去難以獲取的數(shù)據(jù)源[6,22],上文綜述的文獻(xiàn)中標(biāo)題、摘要或關(guān)鍵詞中出現(xiàn)大數(shù)據(jù)(Bigdata 或Big Data)的僅有1 篇,正文中出現(xiàn)大數(shù)據(jù)的也僅有2 篇。研究依然依托傳統(tǒng)理論開展,將大數(shù)據(jù)作為一種數(shù)據(jù)資料,研究結(jié)論也并無新的理論突破。而從應(yīng)用移動定位大數(shù)據(jù)的時間來看,GPS 數(shù)據(jù)和公交刷卡數(shù)據(jù)都已有10 多年的研究歷史。近年來出現(xiàn)的手機數(shù)據(jù)在數(shù)據(jù)內(nèi)容上與其并無多大區(qū)別,只是數(shù)據(jù)量有了巨大增長。當(dāng)時研究者并未提出大數(shù)據(jù)這個詞,或者說大數(shù)據(jù)尚不能作為學(xué)術(shù)術(shù)語出現(xiàn)在研究成果中。只是近年來由于商業(yè)、政府等非學(xué)術(shù)機構(gòu)的推動,學(xué)術(shù)界才開始逐漸接受這個詞。

從這些文獻(xiàn)的研究內(nèi)容來看,空間現(xiàn)象描述占主導(dǎo),并且仍然是近年來的研究熱點,理論模型驗證、中心體系分析等方面的研究開始涌現(xiàn),研究的廣度和深度正在逐步提升。說明研究者在掌握基本的數(shù)據(jù)處理技術(shù)后,已開始關(guān)注城市空間現(xiàn)象背后的深層次規(guī)律。移動定位大數(shù)據(jù)由于具有較豐富的空間信息吸引了地理學(xué)者、計算機學(xué)者、社會學(xué)者跨學(xué)科研究空間問題。

從研究結(jié)論來看,即使經(jīng)過深入的數(shù)據(jù)分析對理論模型和中心體系有所探討,其結(jié)論也只是對一般規(guī)律的描述,缺少新的理論探索和解決實際問題的應(yīng)用。用大數(shù)據(jù)發(fā)現(xiàn)新現(xiàn)象、找出研究問題[30] 的潛力尚未被充分挖掘。這與部分大數(shù)據(jù)缺少社會經(jīng)濟(jì)屬性有關(guān),也與大數(shù)據(jù)需要數(shù)據(jù)處理技術(shù)與規(guī)劃知識的緊密融合有一定關(guān)系,城市規(guī)劃學(xué)者由于缺少數(shù)據(jù)處理技術(shù),在研究中很難真正充分利用數(shù)據(jù),而非規(guī)劃學(xué)者因缺少專業(yè)思想指導(dǎo),又難以提出對規(guī)劃應(yīng)用有實際指導(dǎo)價值的研究問題。

基于上述分析,筆者認(rèn)為大數(shù)據(jù)并不能取代傳統(tǒng)數(shù)據(jù),只是傳統(tǒng)數(shù)據(jù)的有益補充。在研究中應(yīng)充分發(fā)揮兩者各自的優(yōu)勢:大數(shù)據(jù)具有豐富的空間信息,傳統(tǒng)數(shù)據(jù)具有較豐富的社會經(jīng)濟(jì)信息。可用大數(shù)據(jù)來描述、分析空間的現(xiàn)象和規(guī)律,回答“是什么”的問題,再用傳統(tǒng)數(shù)據(jù)來做解釋,回答“為什么”的問題。

三、大數(shù)據(jù)在城市規(guī)劃中適宜的研究方向

基于大數(shù)據(jù)的城市空間研究類型及從文獻(xiàn)中總結(jié)的大數(shù)據(jù)的優(yōu)勢和缺陷、大數(shù)據(jù)研究的局限,筆者認(rèn)為當(dāng)前大數(shù)據(jù)在城市規(guī)劃中適宜于兩方面的研究。一是驗證理論模型和提出研究問題。利用大數(shù)據(jù)豐富的個體移動軌跡信息,從個體出發(fā)以全樣本或大樣本驗證傳統(tǒng)規(guī)劃模型正確與否以及具體參數(shù)的取值,并試圖從中發(fā)現(xiàn)用傳統(tǒng)小數(shù)據(jù)難以發(fā)現(xiàn)的“不符合一般認(rèn)識”的現(xiàn)象和規(guī)律,提出有意義的研究問題,為規(guī)劃研究提供思路。二是分析空間現(xiàn)狀和評估空間規(guī)劃。應(yīng)用大數(shù)據(jù),建立一種自下而上的現(xiàn)狀分析途徑,將大數(shù)據(jù)分析得到的現(xiàn)狀結(jié)論與規(guī)劃藍(lán)圖比較,評估現(xiàn)狀或規(guī)劃實施效果,提高規(guī)劃設(shè)計的科學(xué)性、合理性。

基于文獻(xiàn)中的研究方法,筆者認(rèn)為可通過兩種方法實現(xiàn)上述兩方面研究。一是統(tǒng)計匯總。包括:(1)按時間截面匯總每個統(tǒng)計單元的個體數(shù)量,反映特征時間點的人流密度,只要通過簡單的描述統(tǒng)計分析、時間序列分析等方法就能在空間中反映城市的動態(tài)變化過程,結(jié)果往往用熱點圖表示,如拉蒂[6]、塞夫塞克[8]、曼弗雷迪尼[13] 等學(xué)者的研究。(2)按規(guī)律性行為匯總每個統(tǒng)計單元的個體數(shù)量,反映就業(yè)、居住、游憩等活動的空間分布,需要首先依據(jù)一般行為規(guī)律,識別個體行為目的,再用統(tǒng)計學(xué)方法分析不同行為的空間使用特征,如貝克爾[10] 的研究。二是空間計算。即在熱點圖的基礎(chǔ)上運用密度分析、柵格計算、聚類分析等空間計算方法挖掘空間現(xiàn)象背后的規(guī)律,如瑞茲[17]、劉瑜[19]、羅斯[27] 等學(xué)者的研究。

四、結(jié)語

本文通過基于移動定位大數(shù)據(jù)的城市空間研究文獻(xiàn)的梳理,發(fā)現(xiàn)基于大數(shù)據(jù)的城市空間研究的廣度和深度不斷擴展,但是數(shù)據(jù)本身及相關(guān)研究尚存在較多缺陷和局限,需要與傳統(tǒng)數(shù)據(jù)結(jié)合才能發(fā)揮更好的作用,大數(shù)據(jù)在城市規(guī)劃中適宜于驗證理論模型和提出研究問題、分析空間現(xiàn)狀和評估空間規(guī)劃兩方面研究。在信息社會,城市問題更加復(fù)雜,利用大數(shù)據(jù)進(jìn)行規(guī)劃將會變得越來越普遍。規(guī)劃師亟需轉(zhuǎn)變思路,以多學(xué)科協(xié)作的方式積極參與基于大數(shù)據(jù)的城市空間研究,接受新的思維和方法,應(yīng)對城市問題。

關(guān)鍵字:研究特征數(shù)據(jù)隱藏

本文摘自:199IT網(wǎng)

x 基于移動定位大數(shù)據(jù)的城市空間研究進(jìn)展 掃一掃
分享本文到朋友圈
當(dāng)前位置:大數(shù)據(jù)業(yè)界動態(tài) → 正文

基于移動定位大數(shù)據(jù)的城市空間研究進(jìn)展

責(zé)任編輯:editor007 作者:丁亮 鈕心毅 宋小冬 |來源:企業(yè)網(wǎng)D1Net  2015-11-19 17:39:21 本文摘自:199IT網(wǎng)

326326032

通過文獻(xiàn)梳理,發(fā)現(xiàn)大數(shù)據(jù)為空間研究提供了豐富的樣本,但當(dāng)前的數(shù)據(jù)存在非全樣本、缺少社會經(jīng)濟(jì)屬性、非隨機缺失的缺陷。大數(shù)據(jù)研究的廣度和深度正在不斷擴展,呈現(xiàn)出多學(xué)科參與的特點,但研究結(jié)論還缺少新的理論探索和解決實際問題的應(yīng)用。據(jù)此提出當(dāng)前的大數(shù)據(jù)只是傳統(tǒng)數(shù)據(jù)的有益補充,適用于描述、分析空間現(xiàn)象和規(guī)律,適宜于兩方面研究:驗證理論模型、提出研究問題;分析空間現(xiàn)狀、評估空間規(guī)劃。這兩方面研究可通過統(tǒng)計匯總和空間計算的方法實現(xiàn)。

關(guān)鍵詞:移動定位,大數(shù)據(jù),城市空間研究,城市規(guī)劃

近年來隨著移動定位服務(wù)和云處理技術(shù)的發(fā)展,搜集和處理個人定位信息已成為現(xiàn)實。由移動定位數(shù)據(jù)組成的海量數(shù)據(jù)(大數(shù)據(jù))庫打破了傳統(tǒng)的資料搜集方式,推動了城市空間研究的發(fā)展。諸多學(xué)者利用當(dāng)前可獲取的移動定位大數(shù)據(jù)(本文中的大數(shù)據(jù)均指移動定位大數(shù)據(jù),包括手機數(shù)據(jù)、公交刷卡數(shù)據(jù)、GPS 數(shù)據(jù)、社交網(wǎng)站簽到數(shù)據(jù)等)開展了城市空間研究,取得了較豐富的成果。當(dāng)前已有國內(nèi)學(xué)者對這些研究成果做了介紹,如秦蕭等從城市等級體系、交通、功能區(qū)、特征與活動、社交關(guān)系、重大事件等方面介紹了大數(shù)據(jù)在城市空間研究中的最新進(jìn)展,提出了基于大數(shù)據(jù)的城市空間研究體系[1]。葉宇等從實體空間、社會空間兩方面介紹了大數(shù)據(jù)在城市空間研究中的成果,提出大數(shù)據(jù)時代城市規(guī)劃在數(shù)據(jù)搜集、響應(yīng)速度、編制方式、決策輔助、編制策略、關(guān)注要點、實施過程、評價力度等方面面臨革新[2]。冉斌等提出了手機定位數(shù)據(jù)在不同層面城市規(guī)劃中的應(yīng)用方向,并論述了職住人口空間分布、OD 客流分布、城市間客流聯(lián)系等方面的應(yīng)用實例[3]。任頤等用無錫手機數(shù)據(jù)探索了通勤人口分布、居民出行OD、重點區(qū)域人口集散特征等方面的應(yīng)用[4]。

這些論文重在對已有研究和應(yīng)用成果做較系統(tǒng)的歸納整理,有的還構(gòu)建了基于大數(shù)據(jù)的城市研究框架,對于近年來熱議的“大數(shù)據(jù)時代城市規(guī)劃如何應(yīng)對機遇與挑戰(zhàn)”提供了借鑒。但筆者認(rèn)為城市規(guī)劃作為一門實踐性較強的學(xué)科,在使用數(shù)據(jù)時必須根據(jù)數(shù)據(jù)的特點加以不同方式的利用,方能使數(shù)據(jù)真實反映城市現(xiàn)狀問題,為規(guī)劃設(shè)計提供幫助。因此,還有必要對大數(shù)據(jù)及其研究特征作一個較深入的分析,包括大數(shù)據(jù)與傳統(tǒng)數(shù)據(jù)相比有何優(yōu)勢和缺陷,當(dāng)前大數(shù)據(jù)研究中遇到哪些局限等問題。本文選取了收錄在Web of Science 上的聚焦城市規(guī)劃的對象--空間的文獻(xiàn)進(jìn)行分析,以期能從這些文獻(xiàn)中解答上述問題,梳理出大數(shù)據(jù)在城市規(guī)劃中適宜的研究。

一、基于大數(shù)據(jù)的城市空間研究類型

艾斯(Ahas)等是較早提出可用手機的移動定位數(shù)據(jù)進(jìn)行城市空間研究的學(xué)者。2005 年他提出基于手機的社會定位方法(Social Positioning Method)能監(jiān)測人口總量和移動軌跡、預(yù)測和防止由人流集聚產(chǎn)生的問題,這一方法會在不久的將來獲得廣泛應(yīng)用,并從根本上改變公共生活和公共管理[5],但文中并未闡述具體的研究成果。隨后,拉蒂(Ratti)等于2006 年以熱點圖的方式展現(xiàn)了用手機數(shù)據(jù)分析城市活動時空變化的研究成果。提出“隨著新技術(shù)的發(fā)展,人們的生活和工作習(xí)慣正在發(fā)生變化,活動變得更加靈活,城市的動態(tài)性正在變得更加復(fù)雜,需要新的方法和數(shù)據(jù)來分析城市”。拉蒂在文中還提出了“移動景觀”(MobileLandscapes)的概念,來回答如何記錄OD、如何理解個體移動以及城市形態(tài)和流之間是什么關(guān)系,認(rèn)為移動景觀能反映時實移動圖,而不需要再借助傳統(tǒng)模型。并將米蘭20 km×20 km 空間范圍內(nèi)2004 年4 月19 日-5 月4 日的移動通話時長數(shù)據(jù)匯總為人流密度,可視化反映人流活動分別在白天、晚上以及工作日、周末、重大活動日等不同時間段的變化[6]。這一研究開啟了應(yīng)用移動定位數(shù)據(jù)大范圍、大樣本、動態(tài)認(rèn)識城市系統(tǒng)的研究領(lǐng)域:通過數(shù)據(jù)的統(tǒng)計匯總,認(rèn)為城市空間活動雖然由無數(shù)個體的無序活動組成,但在整體層面有規(guī)律可循,可以用移動定位數(shù)據(jù)來反映城市活動的時空變化。

此后便有學(xué)者在拉蒂的研究基礎(chǔ)上,用手機數(shù)據(jù)、公交刷卡數(shù)據(jù)、GPS 數(shù)據(jù)、社交網(wǎng)站簽到數(shù)據(jù)等移動定位大數(shù)據(jù)探索城市空間研究,并將研究由描述空間的表面現(xiàn)象、識別空間功能深入到驗證傳統(tǒng)理論模型、分析空間聯(lián)系測度中心體系。

(一)空間現(xiàn)象描述

拉蒂的研究對用移動定位大數(shù)據(jù)開展城市空間研究已經(jīng)產(chǎn)生了較大影響,至2015 年1 月已在Web of Science 上有117 次被引,是同類論文中最多的。受拉蒂的影響,諸多學(xué)者開展了類似的研究。例如,維埃拉(Vieira)等用手機通話、短信數(shù)據(jù)表征人流密度變化,發(fā)現(xiàn)中心區(qū)工作日早上密度最高,下午密度下降,晚上商業(yè)、商務(wù)區(qū)和地鐵線周圍密度最高,郊區(qū)周末早上和下午密度最高等現(xiàn)象[7]。塞夫塞克(Sevtsuk)等利用羅馬398 個基站的手機通話時長數(shù)據(jù)研究日?;顒拥囊?guī)律,發(fā)現(xiàn)通話時長可以分為24 小時(即每天的活動是有規(guī)律的)、3.5 天(即工作日和周末的規(guī)律是不同的)、12 小時(表示晝夜的活動規(guī)律)和8 小時(表示工作時間、非工作時間的活動規(guī)律)的周期,大多數(shù)活動都有規(guī)律可循,不同地區(qū)的活動受人口、設(shè)施、環(huán)境等因素影響[8]??巳鹚圭辏↘risp)用赫爾辛基的手機數(shù)據(jù)研究人流密度時實分布情況作為消防和安全設(shè)施布局的依據(jù)[9]。貝克爾(Becker)等利用手機通話和短信數(shù)據(jù)研究莫里斯敦(Morristown)工作、娛樂人群的居住地分布,發(fā)現(xiàn)莫里斯敦對周邊地區(qū)就業(yè)活動的吸引力大于娛樂活動的吸引力,作者還利用通話和短信記錄區(qū)分人群,發(fā)現(xiàn)工作時間比非工作時間使用短信多的人群的空間分布范圍更大[10]。塞戈(Sagl)等用烏迪內(nèi)(Udine)的手機握手?jǐn)?shù)據(jù)、通話時長數(shù)據(jù)和Flicker 社交網(wǎng)站簽到數(shù)據(jù)分析城市不同時段的活動強度。由手機數(shù)據(jù)發(fā)現(xiàn)西部地區(qū)與中心區(qū)的聯(lián)系比東部地區(qū)與中心區(qū)的聯(lián)系強,西北地區(qū)的通信呈現(xiàn)雙峰特征;由社交網(wǎng)站簽到數(shù)據(jù)發(fā)現(xiàn)不同地點的活動特征受季節(jié)影響[11]。隨后又用手機通話、短信數(shù)據(jù),通過可視化分析方法研究烏迪內(nèi)工作日和周末空間活動的時實變化[12]。曼弗雷迪尼(Manfredini)等利用2009 年和2010 年蒙扎(Monza)和布里安扎(Brianza)的手機通話時長、短信、移動交換中心活躍用戶數(shù)據(jù)研究城市動態(tài)活動,提出可以用手機數(shù)據(jù)描述城市空間以小時、天、周為單位的使用強度變化,以此為依據(jù)制定城市政策、計算人口密度、時實監(jiān)測本地和外來人口[13]。約翰(John)等用手機數(shù)據(jù)模擬愛爾蘭區(qū)域性人口流動,結(jié)合馬爾科夫鏈分析人口密度分布,這一研究結(jié)果與中央統(tǒng)計局的人口普查數(shù)據(jù)高度一致[14]。上述研究中使用的手機數(shù)據(jù)有通話時長、通話頻次、短信量、握手?jǐn)?shù)據(jù)等,用來表征城市空間活動強度的統(tǒng)計口徑并不統(tǒng)一。因此,康朝貴等對研究中用通話時長、通話頻次、手機用戶數(shù)能否表示真實的人流活動提出了質(zhì)疑,通過研究3 個數(shù)據(jù)與2008 年全球人口動態(tài)統(tǒng)計分析數(shù)據(jù)(LandScan)的關(guān)系發(fā)現(xiàn),通話時長和通話頻次的關(guān)系隨時間變化,通話頻次與手機用戶數(shù)呈線性相關(guān),手機用戶數(shù)和真實人口數(shù)量的比例在不同地區(qū)是不同的,不能用來表示真實的人口數(shù)量,因此,通話活動能反映活動強度但不能代表人口分布[15]。

空間現(xiàn)象描述利用大數(shù)據(jù)大樣本、高頻率的優(yōu)點,用簡單的統(tǒng)計匯總、可視化表達(dá)就能實現(xiàn)傳統(tǒng)調(diào)查方法難以開展的研究。但是,研究結(jié)論只是一般現(xiàn)象的描述,并未深入分析、挖掘現(xiàn)象背后的規(guī)律。

(二)空間功能識別

部分學(xué)者在用大數(shù)據(jù)描述空間現(xiàn)象的基礎(chǔ)上通過空間計算,根據(jù)空間使用特征識別其主導(dǎo)功能,包括識別不同的功能區(qū)、土地使用類型等。例如,瑞茲(Reades)等將羅馬47 km2 劃分為1 600 m2 為單位的柵格,計算每個柵格的平均通話時長并進(jìn)行標(biāo)準(zhǔn)化處理,并用聚類分析分離出8 類地區(qū),識別羅馬中心城區(qū)邊界[16]。此后又用特征分解法(EigendeComposition)識別和提取羅馬100 萬手機用戶的通話時長數(shù)據(jù),以柵格數(shù)據(jù)反映日間熱點地區(qū),發(fā)現(xiàn)與用企業(yè)黃頁數(shù)據(jù)得到的商業(yè)密度分布非常契合。研究結(jié)果證實了可用手機數(shù)據(jù)來進(jìn)行空間計算和比較分析[17]。齊觀德(Guande)等利用杭州300 萬條出租車GPS 數(shù)據(jù),分析載客量與城市社會功能區(qū)的關(guān)系。發(fā)現(xiàn)載客量與社會活動強度有關(guān),不同地區(qū)的載客量不同。作者用聚類法識別不同的社會功能區(qū),準(zhǔn)確率達(dá)到了97.44%[18]。劉瑜等分析了上海6 600 輛出租車的GPS 數(shù)據(jù)。發(fā)現(xiàn)載客量呈現(xiàn)以24 小時為周期的變化規(guī)律,市中心、居住區(qū)、虹橋機場、浦東機場、郊區(qū)5 個點的載客量具有不同的時間序列。進(jìn)而利用普利亞姆(Pulliam)提出的“源-庫”(Source-Sink)模型,通過計算上下客人次的差值聚類來分析土地利用現(xiàn)狀,研究結(jié)果與2007 年的土地使用情況一致性高達(dá)78.5%[19]。裴韜等通過新加坡的手機通話數(shù)據(jù)的聚類分析表征不同的用地類型,準(zhǔn)確率達(dá)到了58.03%,并且發(fā)現(xiàn)用地異質(zhì)性越高準(zhǔn)確率越低,手機基站數(shù)量越多準(zhǔn)確率越高[20]。

空間功能識別解答了用大數(shù)據(jù)描述空間現(xiàn)象是否準(zhǔn)確的疑問。將大數(shù)據(jù)識別的空間功能和普查、統(tǒng)計數(shù)據(jù)進(jìn)行比較,證明了大數(shù)據(jù)有可能較準(zhǔn)確地反映空間和土地使用,可為開展后續(xù)研究提供支撐。但該類研究本身與城市規(guī)劃關(guān)系并不密切,只是開展后續(xù)規(guī)劃研究的基礎(chǔ)。

(三)理論模型驗證

隨著大數(shù)據(jù)研究的廣泛開展,空間現(xiàn)象描述和空間功能識別已經(jīng)較為成熟,但其局限性也日益顯現(xiàn),即對研究的實際貢獻(xiàn)較小,只是數(shù)據(jù)可視化展示和可信性證明。因此,有研究者開始探索大數(shù)據(jù)在驗證距離衰減效應(yīng)、重力模型等理論模型研究中的作用。例如,拉蒂等將英國12 萬個居民和商戶的固定電話時長數(shù)據(jù)賦值到3 042 個柵格中,分析不同地區(qū)的聯(lián)系程度。在兩次迭代后分離出了23 個地區(qū),與行政邊界高度一致,證明了行政邊界不僅影響人口空間分布,還影響通訊交流[21]。卡拉布雷塞(Calabrese)等用聚類分析研究手機用戶的動態(tài)OD 矩陣,發(fā)現(xiàn)手機數(shù)據(jù)和普查數(shù)據(jù)在縣級層面(county level)的交通流、工作日早交通、重力模型的標(biāo)準(zhǔn)差的擬合度分別達(dá)到了0.73、0.76、0.59,但在普查區(qū)層面(census-tract levels)僅有不到0.3、0.36、0.1。作者認(rèn)為這是由于普查區(qū)層面的樣本量較少、統(tǒng)計時間不一致引起的[22]??党F等通過研究439 萬手機用戶的通話數(shù)據(jù)發(fā)現(xiàn)城市間的通話量不但存在距離衰減效應(yīng),還存在位序分布[23]。高松等做了相似研究,發(fā)現(xiàn)哈爾濱90% 的通話距離在20 km 之內(nèi),通話量的距離衰減參數(shù)(1.45)與空間距離衰減參數(shù)(1.60)相似,反映了網(wǎng)絡(luò)空間的距離限制略小于物理空間[24]??ɡ祭兹扔民R塞諸塞州的手機數(shù)據(jù)研究出行距離的影響因素,發(fā)現(xiàn)公共交通越便捷,公眾會越傾向于使用公共交通從而增加出行距離[25]。

理論模型驗證是大數(shù)據(jù)理論研究價值的有益探索。大數(shù)據(jù)不再僅是“炫耀”數(shù)據(jù)可視化及分析技術(shù)的工具,開始吸引關(guān)注理論模型研究的專業(yè)學(xué)者。但當(dāng)前的理論研究還只是對傳統(tǒng)理論的驗證,用大數(shù)據(jù)探索新理論尚有較大難度。

(四)中心體系分析

還有學(xué)者通過空間計算對空間現(xiàn)象開展了更為深入的研究,主要致力于定量分析城市中心體系,通過測度人流量及其空間聯(lián)系識別城市中心、分析中心職能。例如,劉亮等用深圳5 000 個出租車GPS 數(shù)據(jù)和500 萬個公交和地鐵IC 卡數(shù)據(jù),建立了一個時實的城市動態(tài)集成圖(Integrated UrbanMobility Patterns)來認(rèn)知城市、優(yōu)化城市動態(tài)分析方法。作者通過研究地鐵站進(jìn)出人流量發(fā)現(xiàn)世界之窗、崗廈站是居住中心,國貿(mào)、大劇院、華強路、購物公園、車公廟站是工作中心,老街和華強路是購物和娛樂中心。工作日早高峰呈現(xiàn)以世界之窗和崗廈站為中心的由西向東的單向流特征,晚高峰呈現(xiàn)以華強路和大劇院站為中心的由東向西的單向流特征,鐘擺交通量周六大于周日大于工作日。作者又通過分析出租車OD 數(shù)據(jù)發(fā)現(xiàn)羅湖、福田、南山3 個重要的經(jīng)濟(jì)發(fā)展區(qū)聯(lián)系最緊密[26]。羅斯(Roth)等提出世界城市有復(fù)雜的空間結(jié)構(gòu),人口、密度、區(qū)位已經(jīng)發(fā)生了巨大變化,不能用簡單的單中心城市結(jié)構(gòu)來解釋。作者將倫敦203 萬人1 122 萬條地鐵刷卡數(shù)據(jù)在空間上以1 500 m 為半徑進(jìn)行聚類分析,發(fā)現(xiàn)人流向多個中心集聚,證明倫敦是多中心結(jié)構(gòu)的大城市[27]。劉瑜等將上海以人民廣場為圓心的13 km 半徑范圍分為每2 km 為間隔的同心圓,通過每個圈層中出租車上下客人次的差值聚類識別用地功能,發(fā)現(xiàn)由中心至外圍商業(yè)、娛樂用地減少,工業(yè)用地增加,證明了上海呈單中心結(jié)構(gòu)[19]。鐘晨等使用新加坡的公交刷卡數(shù)據(jù)用空間插值(SpatialInterpolation)和匯總統(tǒng)計(Summary Statistics)的方法分析新加坡空間結(jié)構(gòu)的變化。研究發(fā)現(xiàn)隨著公交和地鐵系統(tǒng)的完善,出行距離和客流量都在增長,反映了城市的聯(lián)系強度在加強。因地鐵促進(jìn)了長距離交通,較高中心度的地區(qū)逐漸增加,有地鐵站點的城市樞紐的功能集聚度增強。增長的公共交通客流量主要集中在副中心所服務(wù)的新建社區(qū),證明新加坡正在向多中心城市結(jié)構(gòu)轉(zhuǎn)變[28]。

中心體系分析不同于空間現(xiàn)象描述,多由專業(yè)學(xué)者以研究問題為目標(biāo),借助空間分析方法,應(yīng)用專業(yè)知識分析數(shù)據(jù)、解讀結(jié)果。這類研究與城市規(guī)劃中的空間結(jié)構(gòu)規(guī)劃有密切關(guān)系,識別城市中心、分析中心職能的方法已經(jīng)能用于評估公共中心規(guī)劃的實施效果,展現(xiàn)出了一定的應(yīng)用前景。

二、大數(shù)據(jù)在城市空間研究中的思考

由上述文獻(xiàn)可知,近年來大數(shù)據(jù)研究的關(guān)注度和成果數(shù)量呈上升趨勢?!冻鞘锌萍茧s志》(Journal of UrbanTechnology)2010 年第1 期開設(shè)了地理和規(guī)劃中的移動定位和追蹤(Mobile Positioning and Tracking in Geography andPlanning)專刊,2014 年第2 期又一次開設(shè)了移動通信和城市空間(Mobility,Communication,and Urban Space)專刊。這與當(dāng)前城市空間活動過于復(fù)雜有密切關(guān)系,需要借助大數(shù)據(jù)分析城市中的各種流(Flow)來認(rèn)識由人流、物流、信息流構(gòu)成的網(wǎng)絡(luò)(Network),了解城市要素內(nèi)和要素間的相互作用和關(guān)系,認(rèn)識城市空間的發(fā)展規(guī)律[29] 有密切關(guān)系。但大數(shù)據(jù)在受到熱捧的同時,還需要理性看待,因為大數(shù)據(jù)并非萬能,其研究可能會遇到諸多局限,例如,康朝貴等對通話時長、通話頻次、手機用戶數(shù)能否表示真實的人流活動的質(zhì)疑[15] 值得引起重視?;谏鲜鑫墨I(xiàn),筆者認(rèn)為當(dāng)前大數(shù)據(jù)及其研究存在以下特征。

(一)大數(shù)據(jù)的優(yōu)勢和缺陷

大數(shù)據(jù)的一大特征就是海量數(shù)據(jù),提供個體時實移動軌跡數(shù)據(jù)。從文獻(xiàn)中可知出租車GPS 數(shù)據(jù)的樣本量和記錄量分別約為103 / 天和105/ 天,公交刷卡數(shù)據(jù)為106/ 天和107/ 天,手機數(shù)據(jù)更是高達(dá)107/ 天和108/ 天(不同城市可能會有所差別),遠(yuǎn)遠(yuǎn)超出了傳統(tǒng)調(diào)查方法能夠獲取的數(shù)據(jù)量。從數(shù)據(jù)內(nèi)容來看,雖然數(shù)據(jù)產(chǎn)生和存儲不是以空間研究為目的(例如,手機數(shù)據(jù)是通信商為了解基站負(fù)荷,以便及時增減基站而存儲),但數(shù)據(jù)中包含的“誰-什么時候-在什么地方”的信息與城市空間研究所需的樣本空間數(shù)據(jù)基本一致,為定量分析提供了充足的樣本。

但大數(shù)據(jù)也有缺陷。首先,“大數(shù)據(jù)就是全樣本”[30] 只是在理論上成立,公交刷卡數(shù)據(jù)、GPS 數(shù)據(jù)、手機數(shù)據(jù)等都只記錄了特定人群的時空軌跡(例如,公交刷卡數(shù)據(jù)只記錄了使用公交卡的用戶的數(shù)據(jù)),這種抽樣是非隨機的,是否能準(zhǔn)確代表總體時空軌跡特征存在質(zhì)疑[25]。其次,數(shù)據(jù)內(nèi)容單一,僅有空間信息,不包含樣本的年齡、收入、職業(yè)等社會經(jīng)濟(jì)信息[25],只能通過數(shù)據(jù)反映空間的現(xiàn)象和規(guī)律,而難以解釋其背后的社會經(jīng)濟(jì)原因。在這種情況下,研究者只能以一般行為規(guī)律為依據(jù),識別行為目的,以試圖挖掘數(shù)據(jù)隱藏的信息。但根據(jù)龍瀛等的研究,從公交刷卡數(shù)據(jù)中能同時識別居住和工作地的用戶僅占總用戶的2.8%[31] ;根據(jù)艾斯的研究,從手機數(shù)據(jù)中能同時識別居住和工作地的用戶僅占總用戶的44.5%[32]。大數(shù)據(jù)一旦進(jìn)行識別處理,其以全樣本保證抽樣隨機性的優(yōu)勢就不復(fù)存在,識別結(jié)果很有可能會與總體產(chǎn)生偏差,在如此大樣本情況下這種偏差尚缺少科學(xué)方法校準(zhǔn),總量和空間上偏差多少也難以給出確切數(shù)據(jù)。若用識別數(shù)據(jù)進(jìn)行下一步研究很有可能會產(chǎn)生“精確的錯誤”。最后是數(shù)據(jù)質(zhì)量問題,上文綜述的文獻(xiàn)中雖未提到這一問題,但筆者在研究實踐中[33] 發(fā)現(xiàn)大數(shù)據(jù)并非如邁爾· 舍恩伯格(Mayer-Schonberger)等所說可以“允許不精確”[30]。“允許不精確”需要隨機錯誤這一前提,然而從筆者獲得的數(shù)據(jù)來看,由于數(shù)據(jù)記錄和存儲等問題,數(shù)據(jù)存在非隨機缺失,有的表現(xiàn)為空間缺失,有的表現(xiàn)為記錄缺失。從當(dāng)前的研究成果來看尚缺少驗證數(shù)據(jù)質(zhì)量、提高數(shù)據(jù)應(yīng)用可靠性的方法。

(二)大數(shù)據(jù)研究的局限

從已發(fā)表的文獻(xiàn)來看,大數(shù)據(jù)并未被研究者過度追捧。很多研究者認(rèn)為大數(shù)據(jù)只是提供了過去難以獲取的數(shù)據(jù)源[6,22],上文綜述的文獻(xiàn)中標(biāo)題、摘要或關(guān)鍵詞中出現(xiàn)大數(shù)據(jù)(Bigdata 或Big Data)的僅有1 篇,正文中出現(xiàn)大數(shù)據(jù)的也僅有2 篇。研究依然依托傳統(tǒng)理論開展,將大數(shù)據(jù)作為一種數(shù)據(jù)資料,研究結(jié)論也并無新的理論突破。而從應(yīng)用移動定位大數(shù)據(jù)的時間來看,GPS 數(shù)據(jù)和公交刷卡數(shù)據(jù)都已有10 多年的研究歷史。近年來出現(xiàn)的手機數(shù)據(jù)在數(shù)據(jù)內(nèi)容上與其并無多大區(qū)別,只是數(shù)據(jù)量有了巨大增長。當(dāng)時研究者并未提出大數(shù)據(jù)這個詞,或者說大數(shù)據(jù)尚不能作為學(xué)術(shù)術(shù)語出現(xiàn)在研究成果中。只是近年來由于商業(yè)、政府等非學(xué)術(shù)機構(gòu)的推動,學(xué)術(shù)界才開始逐漸接受這個詞。

從這些文獻(xiàn)的研究內(nèi)容來看,空間現(xiàn)象描述占主導(dǎo),并且仍然是近年來的研究熱點,理論模型驗證、中心體系分析等方面的研究開始涌現(xiàn),研究的廣度和深度正在逐步提升。說明研究者在掌握基本的數(shù)據(jù)處理技術(shù)后,已開始關(guān)注城市空間現(xiàn)象背后的深層次規(guī)律。移動定位大數(shù)據(jù)由于具有較豐富的空間信息吸引了地理學(xué)者、計算機學(xué)者、社會學(xué)者跨學(xué)科研究空間問題。

從研究結(jié)論來看,即使經(jīng)過深入的數(shù)據(jù)分析對理論模型和中心體系有所探討,其結(jié)論也只是對一般規(guī)律的描述,缺少新的理論探索和解決實際問題的應(yīng)用。用大數(shù)據(jù)發(fā)現(xiàn)新現(xiàn)象、找出研究問題[30] 的潛力尚未被充分挖掘。這與部分大數(shù)據(jù)缺少社會經(jīng)濟(jì)屬性有關(guān),也與大數(shù)據(jù)需要數(shù)據(jù)處理技術(shù)與規(guī)劃知識的緊密融合有一定關(guān)系,城市規(guī)劃學(xué)者由于缺少數(shù)據(jù)處理技術(shù),在研究中很難真正充分利用數(shù)據(jù),而非規(guī)劃學(xué)者因缺少專業(yè)思想指導(dǎo),又難以提出對規(guī)劃應(yīng)用有實際指導(dǎo)價值的研究問題。

基于上述分析,筆者認(rèn)為大數(shù)據(jù)并不能取代傳統(tǒng)數(shù)據(jù),只是傳統(tǒng)數(shù)據(jù)的有益補充。在研究中應(yīng)充分發(fā)揮兩者各自的優(yōu)勢:大數(shù)據(jù)具有豐富的空間信息,傳統(tǒng)數(shù)據(jù)具有較豐富的社會經(jīng)濟(jì)信息??捎么髷?shù)據(jù)來描述、分析空間的現(xiàn)象和規(guī)律,回答“是什么”的問題,再用傳統(tǒng)數(shù)據(jù)來做解釋,回答“為什么”的問題。

三、大數(shù)據(jù)在城市規(guī)劃中適宜的研究方向

基于大數(shù)據(jù)的城市空間研究類型及從文獻(xiàn)中總結(jié)的大數(shù)據(jù)的優(yōu)勢和缺陷、大數(shù)據(jù)研究的局限,筆者認(rèn)為當(dāng)前大數(shù)據(jù)在城市規(guī)劃中適宜于兩方面的研究。一是驗證理論模型和提出研究問題。利用大數(shù)據(jù)豐富的個體移動軌跡信息,從個體出發(fā)以全樣本或大樣本驗證傳統(tǒng)規(guī)劃模型正確與否以及具體參數(shù)的取值,并試圖從中發(fā)現(xiàn)用傳統(tǒng)小數(shù)據(jù)難以發(fā)現(xiàn)的“不符合一般認(rèn)識”的現(xiàn)象和規(guī)律,提出有意義的研究問題,為規(guī)劃研究提供思路。二是分析空間現(xiàn)狀和評估空間規(guī)劃。應(yīng)用大數(shù)據(jù),建立一種自下而上的現(xiàn)狀分析途徑,將大數(shù)據(jù)分析得到的現(xiàn)狀結(jié)論與規(guī)劃藍(lán)圖比較,評估現(xiàn)狀或規(guī)劃實施效果,提高規(guī)劃設(shè)計的科學(xué)性、合理性。

基于文獻(xiàn)中的研究方法,筆者認(rèn)為可通過兩種方法實現(xiàn)上述兩方面研究。一是統(tǒng)計匯總。包括:(1)按時間截面匯總每個統(tǒng)計單元的個體數(shù)量,反映特征時間點的人流密度,只要通過簡單的描述統(tǒng)計分析、時間序列分析等方法就能在空間中反映城市的動態(tài)變化過程,結(jié)果往往用熱點圖表示,如拉蒂[6]、塞夫塞克[8]、曼弗雷迪尼[13] 等學(xué)者的研究。(2)按規(guī)律性行為匯總每個統(tǒng)計單元的個體數(shù)量,反映就業(yè)、居住、游憩等活動的空間分布,需要首先依據(jù)一般行為規(guī)律,識別個體行為目的,再用統(tǒng)計學(xué)方法分析不同行為的空間使用特征,如貝克爾[10] 的研究。二是空間計算。即在熱點圖的基礎(chǔ)上運用密度分析、柵格計算、聚類分析等空間計算方法挖掘空間現(xiàn)象背后的規(guī)律,如瑞茲[17]、劉瑜[19]、羅斯[27] 等學(xué)者的研究。

四、結(jié)語

本文通過基于移動定位大數(shù)據(jù)的城市空間研究文獻(xiàn)的梳理,發(fā)現(xiàn)基于大數(shù)據(jù)的城市空間研究的廣度和深度不斷擴展,但是數(shù)據(jù)本身及相關(guān)研究尚存在較多缺陷和局限,需要與傳統(tǒng)數(shù)據(jù)結(jié)合才能發(fā)揮更好的作用,大數(shù)據(jù)在城市規(guī)劃中適宜于驗證理論模型和提出研究問題、分析空間現(xiàn)狀和評估空間規(guī)劃兩方面研究。在信息社會,城市問題更加復(fù)雜,利用大數(shù)據(jù)進(jìn)行規(guī)劃將會變得越來越普遍。規(guī)劃師亟需轉(zhuǎn)變思路,以多學(xué)科協(xié)作的方式積極參與基于大數(shù)據(jù)的城市空間研究,接受新的思維和方法,應(yīng)對城市問題。

關(guān)鍵字:研究特征數(shù)據(jù)隱藏

本文摘自:199IT網(wǎng)

電子周刊
回到頂部

關(guān)于我們聯(lián)系我們版權(quán)聲明隱私條款廣告服務(wù)友情鏈接投稿中心招賢納士

企業(yè)網(wǎng)版權(quán)所有 ©2010-2024 京ICP備09108050號-6 京公網(wǎng)安備 11010502049343號

^
  • <menuitem id="jw4sk"></menuitem>

    1. <form id="jw4sk"><tbody id="jw4sk"><dfn id="jw4sk"></dfn></tbody></form>
      主站蜘蛛池模板: 北京市| 伊宁县| 句容市| 枝江市| 怀柔区| 彰武县| 如东县| 庆安县| 汾阳市| 漾濞| 咸阳市| 竹北市| 台北市| 梅州市| 福清市| 调兵山市| 永宁县| 凯里市| 永宁县| 昭苏县| 大兴区| 江城| 馆陶县| 怀柔区| 西乌| 外汇| 区。| 峨眉山市| 思南县| 德保县| 南安市| 基隆市| 万源市| 休宁县| 富平县| 汉寿县| 洛川县| 诏安县| 连城县| 芦山县| 南城县|