近年來,“大數據”風靡一時,各行各業都在探討“大數據”思維與技術在本行業的應用。高速公路是否可以應用“大數據”解決相關問題呢?
近期,由中國公路學會主辦的第十六屆中國高速公路信息化研討會暨技術產品展示會在山東青島召開,不少代表對大數據在交通運輸行業的應用提出了自己的精彩見解。
公路海量數據潛在價值巨大
據了解,學界將大數據特點歸納為4個“V”,即Volume(大量)、Velocity(高速)、Variety(多樣)、Value(價值)。事實上,以前并非沒有數據挖掘,而“大數據”理論則與傳統的數據挖掘存在差異。
西安公路研究院姬建崗介紹說,傳統數據挖掘采用的數學方法通常是找到一些自變量與因變量的關系,形成一個因變量與一系列自變量的因果關系,建立一個方程式,繼而進行結果的計算。而“大數據”恰恰是對上述結果的逆向求解,即通過大量數據找到關聯,再去尋找其中蘊含的關系式。大數據是“知其然而不必知其所以然”,外行通過大數據分析可以打敗內行。
長安大學教授許宏科則介紹說,當數據取得時,可能是雜亂無章、看不出規律,但運用作圖、造表、各種形式的方程擬合、計算某些特征量等手段便可找出數據的規律性。
數據挖掘可甄別逃費車輛
山東省交通運輸廳高速公路收費結算中心徐清峻介紹了如何應用數據挖掘實現收費稽查的目的。據了解,山東省專門建設了一套稽查平臺。該平臺根據設定的算法,定期對全省聯網收費數據集中進行逐條甄別,對于符合逃費特征的車輛進行標識和匯總,繼而自動提醒相關部門和各收費站。
“算法很關鍵。”徐清峻分析說,看似正常的一條條車道業務流水,哪些車輛具有逃費嫌疑呢?單條流水自然無法判定,需要結合多條車道,但山東省高速公路每個月產生約五千萬條的收費數據,海量的收費流水數據讓人暈頭轉向。
為此,他們首先分析各種能夠成功偷逃通行費的行為特征,繼而構建能甄別這些數據的唯一算法,這樣就能通過系統找出嫌疑車輛。當然最終確認仍需要通過現場驗證。
“大數據”離不開“云計算”
近年來,與“大數據”一道,“云計算”也成為流行的熱門詞匯。
據了解,“云計算”是將計算任務分布在大量計算機構成的資源池上,使各種應用系統能夠根據需要獲取計算力、存儲空間和信息服務。在許宏科看來,“大數據”的應用需要“云計算”助力。
許宏科分析說,圍繞大數據,一批新興的數據挖掘、數據存儲、數據處理與分析技術將不斷涌現,因此處理海量數據更加容易、更加便宜和迅速。大數據的處理技術正在改變目前的計算機運行模式,大數據的存儲和管理要求,使得云數據庫的建立成為必要條件。
據介紹,2014年交通運輸部開展的交通運輸科技計劃項目中的信息化技術研究計劃,將基于云計算的交通運輸數據交換與處理關鍵技術、綜合交通運行監測與信息服務關鍵技術作為一個重要方向。