聯(lián)通作為三大通信運(yùn)營(yíng)商之一,憑借自身良好的數(shù)據(jù)源基因、經(jīng)過(guò)時(shí)間檢驗(yàn)的數(shù)據(jù)技術(shù)經(jīng)驗(yàn)、不斷深挖的旅游行業(yè)垂直場(chǎng)景,打造運(yùn)營(yíng)商特色的旅游行業(yè)一體化應(yīng)用產(chǎn)品。
聯(lián)通大數(shù)據(jù)推出旅游+大數(shù)據(jù)全方位決策平臺(tái),從游客遷徙、游客畫(huà)像、出行、消費(fèi)、輿情等,助力旅游行業(yè)從傳統(tǒng)旅游向更加開(kāi)放更加生態(tài)更加個(gè)性化更加智能的智慧樂(lè)享旅游轉(zhuǎn)變,助力旅游行業(yè)供給側(cè)改革,提升游客暢游體驗(yàn),降低游客出行決策成本,加強(qiáng)相關(guān)部門(mén)的監(jiān)管效率和質(zhì)量,洞察旅游產(chǎn)業(yè)相關(guān)的信息交叉關(guān)聯(lián)互通,全面賦能旅游行業(yè)。
大數(shù)據(jù)催化旅游行業(yè)變革
信息存儲(chǔ)技術(shù)和采集觸點(diǎn)設(shè)備的提升,使得行業(yè)數(shù)據(jù)量呈指數(shù)級(jí)增長(zhǎng),大數(shù)據(jù)處理技術(shù)的改革創(chuàng)新,使得大數(shù)據(jù)不只停留在科幻作品和理論階段,更成為各行業(yè)產(chǎn)業(yè)結(jié)構(gòu)優(yōu)化提升的催化劑。大數(shù)據(jù)基礎(chǔ)支撐技術(shù)的夯實(shí)和迭代、數(shù)據(jù)應(yīng)用的百花齊放,使得大數(shù)據(jù)進(jìn)入加速滲透、飛速發(fā)展時(shí)期。
討論數(shù)據(jù),離不開(kāi)其行業(yè)背景和行業(yè)應(yīng)用作為載體。旅游行業(yè)自身的綜合性較高,涉及的交叉行業(yè)多,信息價(jià)值密度高,成為大數(shù)據(jù)的理想試驗(yàn)田。
旅游行業(yè)的產(chǎn)業(yè)綜合程度高,涉及交通行業(yè)、房地產(chǎn)行業(yè)、餐飲行業(yè)等交叉領(lǐng)域,同時(shí)信息高度密集,游客、管理者、運(yùn)營(yíng)者等行業(yè)參與者皆處于一種高度活躍的數(shù)據(jù)產(chǎn)生狀態(tài)。在大數(shù)據(jù)快速發(fā)展的影響下,旅游行業(yè)的數(shù)據(jù)源得到指數(shù)級(jí)的擴(kuò)展,讓旅游數(shù)據(jù)分析方法和工具有了更多更好的選擇,旅游數(shù)據(jù)分析的內(nèi)容和方向也得到了極大的豐富和深化。
旅游行業(yè)的發(fā)展已經(jīng)上升至國(guó)家戰(zhàn)略,被寫(xiě)入國(guó)家《政府工作報(bào)告》,迸發(fā)著蓬勃的生命力。旅游人次不斷攀升和消費(fèi)升級(jí)持續(xù)升溫,亟需進(jìn)行服務(wù)能力的提升、產(chǎn)業(yè)結(jié)構(gòu)的優(yōu)化,價(jià)值邊界的拓展,以及商業(yè)模式的探索創(chuàng)新,智慧旅游的呼聲越來(lái)越烈。這些都依賴于針對(duì)海量旅游行業(yè)數(shù)據(jù)的統(tǒng)計(jì)分析處理,來(lái)以洞見(jiàn)旅游相關(guān)人群的遷徙規(guī)律、信息交流和共享方式、消費(fèi)模式等,從而利用分析結(jié)果來(lái)指導(dǎo)行業(yè)的運(yùn)營(yíng)、監(jiān)管和決策。
運(yùn)營(yíng)商大數(shù)據(jù)在旅游行業(yè)極具應(yīng)用價(jià)值
大眾旅游時(shí)代已經(jīng)到來(lái),旅游產(chǎn)業(yè)已經(jīng)成為國(guó)家戰(zhàn)略,將迎來(lái)更多的模式創(chuàng)新和發(fā)展機(jī)遇,技術(shù)和政策雙重紅利的釋放背景下,大數(shù)據(jù)大有可為。那么通信運(yùn)營(yíng)商作為海量數(shù)據(jù)資源的擁有者和大數(shù)據(jù)應(yīng)用的先行者,能為旅游行業(yè)帶來(lái)些什么呢?
通信運(yùn)營(yíng)商是提供固定電話、移動(dòng)電話和互聯(lián)網(wǎng)接入的提供者,是移動(dòng)終端入口的掌握者,隨著大數(shù)據(jù)時(shí)代的到來(lái),這兩項(xiàng)功能的背后蘊(yùn)含的億級(jí)別客戶的不間斷產(chǎn)生的數(shù)據(jù)流量,是業(yè)界公認(rèn)的一座金礦。對(duì)于旅游行業(yè)來(lái)講,通信運(yùn)營(yíng)商數(shù)據(jù)的全面性、多維性、中立性、完整性等特點(diǎn),可以解決旅游行業(yè)數(shù)據(jù)離散的問(wèn)題,極具應(yīng)用價(jià)值。
首先,在高速發(fā)展的“移動(dòng)互聯(lián)網(wǎng)”時(shí)代,運(yùn)營(yíng)商的數(shù)據(jù)管道特性具備先天優(yōu)勢(shì),所有和手機(jī)相關(guān)的互聯(lián)網(wǎng)行為,運(yùn)營(yíng)商能準(zhǔn)實(shí)時(shí)的獲取到。其次,運(yùn)營(yíng)商的數(shù)據(jù)資源豐富,采集的數(shù)據(jù)維度豐富。另外,運(yùn)營(yíng)商的數(shù)據(jù)具有時(shí)序性的特點(diǎn),可以對(duì)用戶行為的時(shí)間、位置移動(dòng)的時(shí)間進(jìn)行連續(xù)性的分析。
在旅游行業(yè),運(yùn)營(yíng)商在數(shù)據(jù)安全合法下對(duì)群體的游客進(jìn)行分析匯總,得出統(tǒng)計(jì)級(jí)的規(guī)律性數(shù)據(jù),快速推進(jìn)旅游行業(yè)的信息化進(jìn)程,全流程進(jìn)行洞察和運(yùn)營(yíng)能力提升。
運(yùn)營(yíng)商可以在旅游全流程獲取的數(shù)據(jù)資源情況可分為三種。
在游前,游客會(huì)下載和瀏覽旅游相關(guān)的App、會(huì)對(duì)目的地進(jìn)行搜索、檢索景區(qū)關(guān)鍵詞、瀏覽旅游攻略和相關(guān)文章等。這樣行為數(shù)據(jù),運(yùn)營(yíng)商都可以對(duì)其進(jìn)行采集、存儲(chǔ)、分析和挖掘,從而進(jìn)行潛客和游客分析,景區(qū)游客的預(yù)測(cè)和游客行為偏好匯總等。
在游中,運(yùn)營(yíng)商通過(guò)大數(shù)據(jù)分析,可以得到游客的客流量、目的地準(zhǔn)實(shí)時(shí)熱力、游客的來(lái)源地、游覽的路徑、景區(qū)的輿情情況等,還可以進(jìn)行人流預(yù)警、游客的群體偏好統(tǒng)計(jì)。
在游后,運(yùn)營(yíng)商通過(guò)相關(guān)數(shù)據(jù)統(tǒng)計(jì)可以得出游覽的客流數(shù)據(jù)、景區(qū)的Top選擇、游客的畫(huà)像數(shù)據(jù)、景區(qū)的競(jìng)品分析、網(wǎng)絡(luò)評(píng)價(jià)等,并對(duì)游后的相關(guān)信息進(jìn)行分析應(yīng)用,提升精準(zhǔn)營(yíng)銷能力、優(yōu)化安全效率、提高游客服務(wù)。
聯(lián)通大數(shù)據(jù)在旅游行業(yè)創(chuàng)新和探索
大數(shù)據(jù)的行業(yè)賦能,離不開(kāi)對(duì)行業(yè)的業(yè)務(wù)背景的深入研究和特色場(chǎng)景的不斷探索,這集中表現(xiàn)在五個(gè)方面。
第一,一點(diǎn)集中,服務(wù)全國(guó)。
眾所周知,旅游行業(yè)的一大特色就是游客主體流動(dòng)性強(qiáng),空間地理的跨度很大,并且隨著大眾出行時(shí)間的非節(jié)日化,群體出行時(shí)間上的周期性也在逐漸削弱,對(duì)數(shù)據(jù)的跨時(shí)空采集要求很高。中國(guó)聯(lián)通大數(shù)據(jù)早在2014年就率先在業(yè)內(nèi)完成全國(guó)數(shù)據(jù)集中,所謂“一點(diǎn)集中,服務(wù)全國(guó)”。這種數(shù)據(jù)服務(wù)模式在面對(duì)旅游行業(yè)需求時(shí),可以快速擺脫運(yùn)營(yíng)商分省而治的限制,快速支撐數(shù)據(jù)應(yīng)用服務(wù)。
第二,信令數(shù)據(jù)清洗。
通信運(yùn)營(yíng)商的數(shù)據(jù)源維度豐富,包含了上述的身份數(shù)據(jù)、上網(wǎng)行為、通信行為等,但對(duì)于旅游行業(yè)的游客行為研究,最具價(jià)值的數(shù)據(jù)必然是位置數(shù)據(jù)——包括了用戶主動(dòng)、被動(dòng)觸發(fā)的所有行為的時(shí)間和位置信息。而位置數(shù)據(jù)的核心,就是信令數(shù)據(jù)以及工參數(shù)據(jù)。
移動(dòng)通信系統(tǒng)中,如果在一定區(qū)域里兩基站信號(hào)強(qiáng)度劇烈變化,手機(jī)就會(huì)在兩個(gè)基站間來(lái)回切換,對(duì)應(yīng)的信令記錄也會(huì)不斷更新和增加,這就會(huì)產(chǎn)生所謂的“乒乓效應(yīng)”。顯然,用戶一旦進(jìn)入存在“乒乓效應(yīng)”區(qū)域,其信令事件就會(huì)大幅激增,對(duì)信令數(shù)據(jù)分析產(chǎn)生干擾,需要采取一定措施予以解決。
聯(lián)通大數(shù)據(jù)在項(xiàng)目實(shí)施時(shí)對(duì)信令記錄進(jìn)行統(tǒng)計(jì),以基站對(duì)的形式,考察各對(duì)之間的切換數(shù)量,同時(shí)考慮時(shí)間長(zhǎng)度,如果在短時(shí)間內(nèi)切換數(shù)量超過(guò)一定閾值,即認(rèn)為存在“乒乓效應(yīng)”。再利用判定的結(jié)果,提出原始信令數(shù)據(jù)中的記錄,完成對(duì)數(shù)據(jù)的清洗。大大提高信令事件的可用性以及分析結(jié)果的準(zhǔn)確性。
第三,聯(lián)通大數(shù)據(jù)游客模型構(gòu)建。
旅游垂直行業(yè)展開(kāi)數(shù)據(jù)分析的一個(gè)前提是,分析的主體為游客。簡(jiǎn)單的兩個(gè)字,背后隱藏著一個(gè)模糊的概念,何為游客,怎樣去定義,怎樣去做基礎(chǔ)數(shù)據(jù)源的組合和篩選比較合理?;诙嗄甑男袠I(yè)服務(wù)經(jīng)驗(yàn),以及與權(quán)威部門(mén)-國(guó)家旅游局的合作探討,中國(guó)聯(lián)通大數(shù)據(jù)的運(yùn)營(yíng)商特色的游客口徑定義如下:
規(guī)定游客原始統(tǒng)計(jì)口徑基于原始信令日表數(shù)據(jù),基于聯(lián)通職住地模型,在剔除職住地用戶的前提下,選取停留時(shí)長(zhǎng)>=6小時(shí)的省份、地市和區(qū)縣范圍的用戶,或選取停留時(shí)長(zhǎng)>20分鐘的景區(qū)范圍內(nèi)的用戶,同時(shí)剔除流入地市30天內(nèi)駐留12天以內(nèi)用戶。
其中6小時(shí)、20分鐘是國(guó)家旅游局官方的游客標(biāo)準(zhǔn),12天則是具體的項(xiàng)目合作中逐漸沉淀的較科學(xué)的過(guò)濾條件。這樣就使得我們的游客口徑更加嚴(yán)謹(jǐn),更加具有決策指導(dǎo)意義。
前面提到的職住地模型,即聯(lián)通大數(shù)據(jù)公司研發(fā)的工作地模型、居住地模型。大數(shù)據(jù)公司的研發(fā)團(tuán)隊(duì)首先根據(jù)大多數(shù)人的作息規(guī)律,按時(shí)間段區(qū)分職和住(?。?2:00-8:00,職;9:00-17:00 ),把日信令數(shù)據(jù)灌進(jìn)聯(lián)通大數(shù)據(jù)的數(shù)據(jù)平臺(tái),每日形成用戶的一個(gè)poi點(diǎn),每個(gè)月進(jìn)行一次計(jì)算,取出現(xiàn)次數(shù)最多的三個(gè)poi的經(jīng)緯度作為職住地,按照日處理月計(jì)算的形式提供職住地信息。即通過(guò)對(duì)個(gè)人日間駐留地的長(zhǎng)期歷史數(shù)據(jù)分析。篩選出個(gè)人日間駐留頻次最多,時(shí)長(zhǎng)最長(zhǎng)的地點(diǎn),作為個(gè)人的工作地。通過(guò)對(duì)個(gè)人夜間駐留地的長(zhǎng)期歷史數(shù)據(jù)分析。篩選出個(gè)人夜間駐留頻次最多,時(shí)長(zhǎng)最長(zhǎng)的地點(diǎn),作為個(gè)人的居住地。
第四,質(zhì)心點(diǎn)校驗(yàn)。
聯(lián)通大數(shù)據(jù)將用戶的停留狀態(tài)信息定位至空間網(wǎng)格之上,并通過(guò)一系列技術(shù)手段,不斷進(jìn)行位置校正,盡可能真實(shí)地在空間網(wǎng)格上映射出用戶位置。通過(guò)對(duì)信令數(shù)據(jù)的長(zhǎng)時(shí)間觀察和沉淀,將同一個(gè)用戶在某一區(qū)域的多次位置相近的停留匯聚為一個(gè)較大的停留偏好區(qū)域,并參考觀察時(shí)間窗口內(nèi)的每一次停留網(wǎng)格的中心點(diǎn)和出現(xiàn)的頻次,根據(jù)出現(xiàn)的頻次為每個(gè)停留網(wǎng)格的中心點(diǎn)進(jìn)行相應(yīng)加權(quán),最終根據(jù)加權(quán)系數(shù)確定偏好區(qū)域的質(zhì)心位置。
這樣做,既兼顧了將相近的停留點(diǎn)歸一化統(tǒng)計(jì)的要求,大大沖抵了離散點(diǎn)對(duì)位置的干擾,又根據(jù)用戶的真實(shí)位置信息對(duì)停留位置做了更精準(zhǔn)的推測(cè)。
第五,柵格化。
信令數(shù)據(jù)的人流分析顆粒度主要為基站覆蓋面積大小,位置類的數(shù)據(jù)完全依賴于信令基站。這樣統(tǒng)計(jì)的時(shí)候會(huì)有局限性,比如:統(tǒng)計(jì)的區(qū)域范圍比較小,但是基站覆蓋的范圍比較大的時(shí)候,會(huì)導(dǎo)致客流統(tǒng)計(jì)出來(lái)數(shù)據(jù)量大(包含了周圍)。要解決這個(gè)問(wèn)題,就需要對(duì)地理位置進(jìn)行刪格化的處理,傳統(tǒng)柵格劃分250*250m的格子后,生成碼表,基站經(jīng)緯度數(shù)據(jù)入格時(shí)需要查表或做經(jīng)緯度判斷,效率不高。
聯(lián)通大數(shù)據(jù)公司的刪格處理方式是信令數(shù)據(jù)進(jìn)行軌跡分析后,得到去除大部分噪聲的準(zhǔn)確經(jīng)緯度駐留坐標(biāo)。在此基礎(chǔ)上進(jìn)行入格處理。柵格模型可直接對(duì)經(jīng)緯度入格,無(wú)需查表。柵格大小(顆粒度),可進(jìn)行調(diào)整??蜻x目標(biāo)區(qū)域后,柵格統(tǒng)計(jì)信息通過(guò)面積計(jì)算加權(quán),可以更精確的反映該目標(biāo)區(qū)域內(nèi)統(tǒng)計(jì)信息。
聯(lián)通大數(shù)據(jù)旅游行業(yè)的應(yīng)用實(shí)踐
大數(shù)據(jù)不是數(shù)據(jù)的簡(jiǎn)單的集合,而是充分挖掘數(shù)據(jù)的價(jià)值并加以運(yùn)用。數(shù)據(jù)價(jià)值重在應(yīng)用。在運(yùn)營(yíng)商中,聯(lián)通大數(shù)據(jù)旅游行業(yè)的探索發(fā)揮了“先鋒”作用。早在2014年中國(guó)聯(lián)通就進(jìn)入旅游行業(yè),通過(guò)數(shù)據(jù)建模和數(shù)據(jù)分析實(shí)現(xiàn)對(duì)游客的精準(zhǔn)分析。到至今,聯(lián)通大數(shù)據(jù)通過(guò)真實(shí)、實(shí)時(shí)、有效的數(shù)據(jù)服務(wù)于景區(qū)、涉旅企業(yè)和旅游機(jī)構(gòu)等。
在整體架構(gòu)方面,大數(shù)據(jù)支撐旅游智慧化,結(jié)合旅游局、景區(qū)、涉旅企業(yè)、游客4類服務(wù)對(duì)象的需求進(jìn)行旅游產(chǎn)品的建設(shè)。讓數(shù)據(jù)使旅游更智慧,解決游客來(lái)自哪里、游客關(guān)注什么方面、游客有哪些不滿、哪些地方和時(shí)段易出現(xiàn)游客擁堵、哪些景點(diǎn)最受游客歡迎、哪些線路游客不多等等問(wèn)題。
在應(yīng)用實(shí)踐方面,首先是構(gòu)建了“旅游+”全方位決策支撐平臺(tái)。
旅游大數(shù)據(jù)平臺(tái)從2015年1.0版本開(kāi)始,到2018年迭代升級(jí)成“旅游+”全方位支撐平臺(tái),“旅游+”的含義就是以運(yùn)營(yíng)商數(shù)據(jù)為基礎(chǔ),橫向擴(kuò)展、縱向貫穿,打造旅游行業(yè)的規(guī)模資源池。
平臺(tái)的主要目標(biāo)是:第一,運(yùn)營(yíng)商大數(shù)據(jù)與旅游行業(yè)基礎(chǔ)數(shù)據(jù)進(jìn)行整合、分析、挖掘、預(yù)測(cè)。第二,解決信息孤島、數(shù)據(jù)采集標(biāo)準(zhǔn)、信息交換和數(shù)據(jù)共享的問(wèn)題。第三,構(gòu)建全域旅游數(shù)據(jù)資源庫(kù),利用科學(xué)化、智能化、人性化的大數(shù)據(jù)分析系統(tǒng),發(fā)揮數(shù)據(jù)綜合服務(wù)和應(yīng)用效能,為旅游管理部門(mén)提供多維度精準(zhǔn)分析及有效挖掘。
版本發(fā)布后,迅速在山東落地。“旅游+”平臺(tái)現(xiàn)在主要有12個(gè)功能模塊,未來(lái)在數(shù)據(jù)資源不斷地完善擴(kuò)充下,會(huì)進(jìn)行功能的累積迭代,以此突出“+”的特征。
12個(gè)功能模塊
其次是發(fā)布旅游大數(shù)據(jù)報(bào)告。
旅游大數(shù)據(jù)報(bào)告以群體游客為主要研究對(duì)象,以旅游產(chǎn)業(yè)發(fā)展為主要研究目標(biāo),對(duì)游客行為偏好、游客畫(huà)像、游客路徑選擇、游客停留天數(shù)、游客交通工具、游客來(lái)源地等進(jìn)行多維度的分析。以群體游客的分析數(shù)據(jù)反映特定城市、特定區(qū)域或者特定景區(qū)的特點(diǎn)和問(wèn)題,以此推動(dòng)整個(gè)旅游產(chǎn)業(yè)的良性循環(huán),帶來(lái)旅游產(chǎn)業(yè)的高速發(fā)展。
旅游大數(shù)據(jù)報(bào)告分為月度報(bào)告、節(jié)假日?qǐng)?bào)告和競(jìng)品分析報(bào)告三種形式。第一是月度報(bào)告,按月統(tǒng)計(jì),以一個(gè)月為主要統(tǒng)計(jì)周期,進(jìn)行指定區(qū)域的各類分析。第二是節(jié)假日?qǐng)?bào)告,按天統(tǒng)計(jì),以特定的節(jié)假日為統(tǒng)計(jì)周期,進(jìn)行指定區(qū)域的分析,包含節(jié)假日和平時(shí)的客流量比對(duì)等,以此判斷節(jié)假日出行的特點(diǎn)和規(guī)律。第三是競(jìng)品分析報(bào)告,按需求,對(duì)兩個(gè)以上的城市、區(qū)域和景區(qū)進(jìn)行比對(duì)分析,從客流量、輿情、游客特點(diǎn)等進(jìn)行比對(duì),輔助本城市或者區(qū)域、景區(qū)等進(jìn)行應(yīng)對(duì)以及變革,促進(jìn)信息化的發(fā)展。
我國(guó)的旅游業(yè)正處在蓬勃發(fā)展時(shí)期,游客對(duì)旅游的品質(zhì)要求也越來(lái)越高。大數(shù)據(jù)的核心價(jià)值在于可以科學(xué)的反應(yīng)出統(tǒng)計(jì)結(jié)果,有效地幫助相關(guān)機(jī)構(gòu)提升決策力。中國(guó)聯(lián)通大數(shù)據(jù)將繼續(xù)積極發(fā)揮自身大數(shù)據(jù)優(yōu)勢(shì),不斷尋找新的切入場(chǎng)景,深挖數(shù)據(jù)價(jià)值,加速大數(shù)據(jù)對(duì)旅游產(chǎn)業(yè)的全方位賦能。