隨著大數(shù)據(jù)時(shí)代的到來,民航業(yè)紛紛開始尋求與大數(shù)據(jù)的結(jié)合點(diǎn),亟待用好大數(shù)據(jù)創(chuàng)造盈利點(diǎn)。然而在運(yùn)用大數(shù)據(jù)的過程中,還需要格外注意數(shù)據(jù)收集、整合與分析過程中的科學(xué)性,確保得到的結(jié)論真正具有現(xiàn)實(shí)意義和操作價(jià)值。
網(wǎng)上有新聞稱,基于攜程的大數(shù)據(jù),分析得出購(gòu)買航班延誤險(xiǎn)種人群的結(jié)論:超過6成是男性,年齡集中在30歲~50歲,其中,商務(wù)旅客是購(gòu)險(xiǎn)的主力軍,進(jìn)出北上廣深等地的投保人,占比接近40%。這樣的數(shù)據(jù)包含了若干人口學(xué)要素,然而這樣的數(shù)據(jù)呈現(xiàn)是否真的具有分析意義,能得出何種有價(jià)值的結(jié)論令筆者疑惑。
大數(shù)據(jù)之大,不僅是其中包含的樣本數(shù)量多,數(shù)據(jù)層次豐富,更在于數(shù)據(jù)間的彼此聯(lián)系使得人們更容易繪制出一幅呈現(xiàn)事物內(nèi)在本質(zhì)的圖譜。購(gòu)買延誤險(xiǎn)的性別占比,男性為六成,我們可能得到“男性比女性更傾向于購(gòu)買延誤險(xiǎn)”的結(jié)論,然而我們不了解作者的數(shù)據(jù)來源,是不是把男性乘客和女性乘客分開計(jì)算的,也就是說如果男女乘客人數(shù)不是1:1,那么購(gòu)買延誤險(xiǎn)的男性乘客超六成這個(gè)說法就不嚴(yán)謹(jǐn)。
此外,對(duì)于北上廣深旅客人次多,這是已經(jīng)得到的結(jié)論,并無再次統(tǒng)計(jì)的必要性,由于旅客分布的結(jié)構(gòu)性差異,任何一個(gè)與旅行消費(fèi)的統(tǒng)計(jì)大概都會(huì)得到北上廣深旅客數(shù)據(jù)占優(yōu)的結(jié)論,而這樣又能說明什么呢?此外,采用什么方法獲知數(shù)據(jù)也影響著結(jié)論的價(jià)值,例如攜程得到的數(shù)據(jù)能否全面覆蓋,提取的這段時(shí)間數(shù)據(jù)樣本有沒有代表性,如果延遲險(xiǎn)購(gòu)買者的年齡分布與網(wǎng)絡(luò)使用偏好有關(guān),那它的可信度就只在一定范圍內(nèi)有效。如果民航對(duì)于核心數(shù)據(jù)的分析能力只停留在計(jì)算比值這一步,那大數(shù)據(jù)的作用還遠(yuǎn)遠(yuǎn)未觸及。
大數(shù)據(jù)表面看是數(shù)字,實(shí)則包含一種科學(xué)的態(tài)度,包括采集數(shù)據(jù)、分析數(shù)據(jù)和推導(dǎo)結(jié)論,都需要做到足夠的嚴(yán)謹(jǐn),如果前提預(yù)設(shè)和數(shù)據(jù)收集不能很好地反應(yīng)全面客觀的實(shí)際情況,那得到的結(jié)論可能會(huì)有偏差,很難對(duì)民航業(yè)產(chǎn)生積極的作用。
大數(shù)據(jù)時(shí)代,掌握數(shù)據(jù)源和分析方法同等重要,作為與資金、用戶數(shù)據(jù)密切相關(guān)的民航業(yè),數(shù)據(jù)收集也相對(duì)便利客觀,因此利用好大數(shù)據(jù)是民航尋找經(jīng)濟(jì)著力點(diǎn)的有效“利器”,做好大數(shù)據(jù)分析需要專業(yè)的統(tǒng)計(jì)學(xué)、社會(huì)學(xué)專家來完成,然而科學(xué)嚴(yán)謹(jǐn)?shù)姆治龇椒ǎ?jǐn)慎的結(jié)論推導(dǎo)都必須經(jīng)過專業(yè)化的訓(xùn)練,這正是民航面對(duì)大數(shù)據(jù)這塊獨(dú)有蛋糕時(shí)候,應(yīng)當(dāng)學(xué)會(huì)的正確切割方法。