手機(jī)數(shù)據(jù)最獨(dú)特、最吸引人的特點(diǎn),就是它們的普及規(guī)模
近年來,隨著無線通信的廣泛應(yīng)用,車輛GPS、手機(jī)信令、交通卡等空間行為大數(shù)據(jù),被用來非常精確地揭示人類行為移動模式,從而解釋城市的社會經(jīng)濟(jì)環(huán)境。如今,可利用的空間行為大數(shù)據(jù)已經(jīng)包括:移動電話數(shù)據(jù)、車輛軌跡數(shù)據(jù)、智能卡數(shù)據(jù)、Wi-Fi和藍(lán)牙數(shù)據(jù)、社交媒體用戶數(shù)據(jù)等。
這些空間行為大數(shù)據(jù),為確定人類的生活模式提供了一個非常有前途的來源。由于大數(shù)據(jù)可以記錄連續(xù)的空間行為,且隨時間和空間精確變化,研究使用這些數(shù)據(jù),可以細(xì)致揭示城市居民個體不同空間和時間下的交通出行模式。
近幾年,包含交通智能卡和手機(jī)運(yùn)營商數(shù)據(jù)在內(nèi)的城市軌跡大數(shù)據(jù),正在國內(nèi)外成為科學(xué)研究和商業(yè)應(yīng)用的熱點(diǎn)。隨著數(shù)據(jù)處理、模型設(shè)計(jì)、統(tǒng)計(jì)驗(yàn)證方法的不斷成熟,大數(shù)據(jù)正被不斷應(yīng)用到城市生活不同場景的實(shí)踐中。
交通智能卡數(shù)據(jù)
交通智能卡(Smart card)最初應(yīng)用于公共交通的自動收費(fèi)系統(tǒng),如公共汽車、地鐵和停車場。智能卡系統(tǒng)也被引入商店、餐館和醫(yī)院。如今,幾乎在世界各大城市都有自己的智能卡系統(tǒng)。
雖然交通智能卡的主要目的是收集收入信息,但同時也產(chǎn)生了大量非常詳細(xì)的交易數(shù)據(jù)信息。這些數(shù)據(jù)既可以幫助公交系統(tǒng)的日常運(yùn)營,也可以用于相關(guān)網(wǎng)絡(luò)的長期戰(zhàn)略規(guī)劃。可實(shí)現(xiàn)三級管理的各種用途:戰(zhàn)略(中長期規(guī)劃)、戰(zhàn)術(shù)(服務(wù)調(diào)整和網(wǎng)絡(luò)發(fā)展)和運(yùn)作(客流統(tǒng)計(jì)和績效指標(biāo))。
一般,智能卡包含信息包括卡ID、交易數(shù)據(jù)(時間、類型和車費(fèi))、旅行數(shù)據(jù)(出行模式、時間、票價、車站和路線ID)和個人識別數(shù)據(jù)。因此,智能卡中的數(shù)據(jù)可以用于出行需求預(yù)測或個人出行模式檢測。然而,不同于基于距離的票價,智能卡數(shù)據(jù)沒有登記行程,僅有出入站地點(diǎn)。因此,使用智能卡數(shù)據(jù)的一個主要挑戰(zhàn),是如何識別一個完整的旅行軌跡、估計(jì)各種多通道傳輸?shù)目赡堋?/p>
曾有學(xué)者使用倫敦智能卡數(shù)據(jù)中的個人旅行信息,揭示城市的結(jié)構(gòu),提供新的方法來模擬城市系統(tǒng)的流量;基于北京市14個工作日的地鐵刷卡客流量數(shù)據(jù),將195個地鐵站點(diǎn)分為居住導(dǎo)向型、就業(yè)導(dǎo)向型、職住錯位型、錯位偏居住型、錯位偏就業(yè)型、混合型、綜合型及其他型8種不同類型;使用上海申通地鐵數(shù)據(jù),對世博會期間上海軌道交通客流特征進(jìn)行統(tǒng)計(jì)分析。所有這些實(shí)證研究表明,智能卡數(shù)據(jù)對理解城市系統(tǒng)的動態(tài)(各種旅行行為和交通規(guī)劃)非常有效。
國內(nèi)外學(xué)者在公共交通中使用智能卡數(shù)據(jù)進(jìn)行的研究,主要分為三大類:戰(zhàn)略層面上,涉及長期的網(wǎng)絡(luò)規(guī)劃、客戶行為分析和需求預(yù)測;戰(zhàn)術(shù)層面上,重點(diǎn)是地鐵時刻表調(diào)整、縱向和個別的出行模式;業(yè)務(wù)層面,研究相關(guān)的供應(yīng)和需求指標(biāo),以及如何完善智能卡系統(tǒng)可操作性。一旦智能卡搭載上持卡人資料,比如采用使用者實(shí)名制登記,其所呈現(xiàn)的信息的社會人口屬性會更強(qiáng)。
手機(jī)運(yùn)營商數(shù)據(jù)
無論在國內(nèi)還是國外,移動手機(jī)的運(yùn)營商數(shù)據(jù),作為一種軌跡數(shù)據(jù),也已被廣泛用于各類研究和商業(yè)應(yīng)用。
手機(jī)數(shù)據(jù)有兩種類型:基于信元塔的數(shù)據(jù),主要包含小區(qū)塔流量和切換信息;基于移動電話的用戶數(shù)據(jù),通常包含匿名用戶ID、小區(qū)塔ID,以及電話、位置、日期和時間的信息。目前,出于數(shù)據(jù)類型和研究目的的不同,用來處理和分析手機(jī)數(shù)據(jù)的方法,包括傳統(tǒng)的數(shù)據(jù)挖掘技術(shù),如聚類方法和基于規(guī)則的算法,新技術(shù)有可視化工具和復(fù)雜的機(jī)器學(xué)習(xí)方法。
手機(jī)數(shù)據(jù)在出行交通行為研究中最基本的應(yīng)用是檢測逗留(訪問)和提取出行次數(shù)。通常情況下,結(jié)合連續(xù)定位數(shù)據(jù)和歷史定位數(shù)據(jù)、計(jì)算個體在每個區(qū)域的定位頻率,可以檢測該用戶的停留情況。只需要手機(jī)使用的四個時空點(diǎn),就能定義一個人的活動痕跡。
用戶的交通方式,可以使用蜂窩網(wǎng)絡(luò)的數(shù)據(jù),根據(jù)連接信號強(qiáng)度的波動變化率,做較粗略的估計(jì)。目前通過這類數(shù)據(jù)可識別的出行方式,主要包括停止、步行和機(jī)動車出行方式。
范圍更廣的交通方式,可以使用手機(jī)內(nèi)置的GPS和運(yùn)動傳感器,采集更準(zhǔn)確的定位和運(yùn)動狀態(tài)信息,判斷行駛速度和可能的方式。例如,利用智能手機(jī)內(nèi)置GPS和加速度傳感器收集的數(shù)據(jù),可以確定五種運(yùn)輸方式,包括步行、跑步、騎自行車、停止、開車;區(qū)分八種出行方式,包括汽車、自行車、公共汽車、電車、火車、地鐵、步行、摩托車等。應(yīng)用于上述數(shù)據(jù)分析的分類技術(shù),包括決策樹分類器、隱藏的馬爾可夫模型、基于規(guī)則的分類器、人工神經(jīng)網(wǎng)絡(luò)、貝葉斯分類器等。
城市動力學(xué)研究早已開始大規(guī)模使用手機(jī)數(shù)據(jù)。曾有一個名為“移動風(fēng)景”的項(xiàng)目,使用手機(jī)數(shù)據(jù)可視化展示了米蘭城市在時間和空間上的演化。“實(shí)時羅馬項(xiàng)目”,則使用羅馬的手機(jī)和出租車數(shù)據(jù),描繪了城市脈搏。隨著手機(jī)運(yùn)營商數(shù)據(jù)的部分開放,國內(nèi)對手機(jī)信令的研究近幾年開始增多,主要集中在城市規(guī)劃和交通領(lǐng)域中。比如,基于手機(jī)信令,對軌道交通早高峰客流和居民的職住通勤關(guān)系、大都市圈規(guī)劃進(jìn)行研究。
傳統(tǒng)的出行行為研究很難做到這樣幾乎覆蓋到整個人口的樣本。而手機(jī)數(shù)據(jù)最獨(dú)特、最吸引人的特點(diǎn),就是它們的普及規(guī)模。由于其為研究者提供了縱向和個別的大量細(xì)節(jié),因而非常適合用來研究城市管理問題。
(感謝陳瑤博士為本文提供學(xué)術(shù)支持)
欄目主編:龔丹韻 題圖來源:視覺中國 圖片編輯:徐佳敏