和風制
隨著網絡和信息技術的迅猛發展,當前卷煙違法活動呈現出組織網絡化、行為隱蔽化、手段高科技化等特點,亟須專賣稽查人員轉變執法理念、創新案件查辦方式方法。這種情況下,大數據應用開始凸顯其重要性。筆者認為,要進一步明晰大數據在專賣稽查中的具體應用思路,通過構建數據庫、建立分析模型、指導稽查實踐“三步走”,將大數據應用于情報建設、指揮決策和案件經營等方面。
第一步:構建數據庫
高質量的數據庫是大數據應用的前提和基礎。專賣管理部門雖然在案件查辦過程中積累了海量的數據,但種類相對單一。此外,各地在錄入案件數據時,往往缺乏嚴格統一的標準,致使數據結構存在一定差異,對后期的數據對接、整合與分析來說都十分不利。
要擴大數據的來源。除了專賣歷史案件數據和系統數據外,還要將一線業務條線在日常工作中收集的數據進行上報,包括情報信息、走訪情況、客戶資料、舉報投訴、網上線索、對比分析結果等。數據的形式上,除了傳統的文字信息外,還要注重搜集涉嫌違法的圖片、視頻、音頻等數據。
要強化數據的整理。在補全缺失數據,刪除虛假、矛盾、無意義數據的基礎上,參照常用的情報分析“5W1H模型”,將數據錄入結構劃分為“Who(人或者組織基本信息)”“How(行為過程與方式)”“What(行為屬性和特點)”“Which(涉事物品、交通工具、聯系方式、賬戶信息等)”“When(時間)”“Where(地點)”六個部分,每個部分對應不同的數據。例如,“Who”中就包含了姓名、許可證號、身份證號、年齡、戶籍等數據。相關人員只需要將真實的數據錄入相應的空格即可,最終形成標準統一的結構化數據庫。
第二步:建立分析模型
當前,我們對于大數據的分析和研判,大多停留在簡單的人工識別加經驗判斷上,很多有用的情報線索沒有得到及時挖掘和利用,致使有些案件該發現的沒被發現,該查處的沒被查處,失去破案最佳時機。另外,工作人員的操作不當也會導致分析結果的偏差,使數據失去意義。
筆者在這里,主要列舉三種常用的數據分析模型。
數據節點碰撞模型,主要用于挖掘數據節點中重復出現的字段。具體操作中,我們可以利用EXCEL中的COUNTIF函數來實現。例如,已知單元格中A1、A2、A3、A4分別代表不同案件中的涉案人員,B1代表新增情報中的嫌疑人。對單條情報操作時,輸入公式“=COUNTIF(A1:A4,B1)”,輸出結果為2,說明該情報中的嫌疑人在已有案件中出現過2次;當需要對所有案件進行綜合操作時,輸入公式“=IF(COUNTIF(A:A,A1)>1,“重復”)”,輸出結果顯示,A2和A4項重復,說明該當事人曾出現在兩個不同的案件中。
數據熱點分析模型,主要用于分析數據節點中不同字段出現的頻次。具體操作中,我們可以利用EXCEL中的排序功能和統計功能來實現。例如,已知單元格中D1、D2……Dn分別代表不同案件中的案發地點,在對其進行升序或降序排列后可以得到不同地址案發數的頻次分布。頻次越高,說明該地址的違法風險越高。為了便于分析,我們可以對頻次進行分區處理:當頻次超過某一數值a時,設為違法風險高發區;頻次在a~b之間的,設為違法風險中等區;頻次在b以下的,設為違法風險低發區。
數據關聯分析模型,主要用于挖掘不同字段在給定數據節點集中出現的頻率。具體操作中,我們可以利用Ais、Apriori等算法來實現。例如,已知案件中的數據節點有:涉案人員戶籍、案件類型和案發區域。戶籍項中包含X1、X2、X3三個字段,類型項中包含Y1、Y2、Y3三個字段,區域項中包含Z1、Z2、Z3三個字段,一共有27種不同的組合。通過計算,發現(X1,Y2,Z3)出現了6次,占22.2%;(X2,Y1、Z1)出現了4次,占14.8%。一起出現的概率越頻繁,說明這組數據之間的關聯越緊密。
第三步:指導稽查實踐
在專賣稽查實踐中,究竟大數據該怎么用?能發揮怎樣的功效?目前尚處于探索階段。行業內對大數據的應用,主要體現在執法人員考核和案件統計上。沒有形成系統的、對數據價值進行深入開發和利用的體系,致使很多數據都缺少用武之地。
筆者結合以上三種數據分析模型,嘗試將其用于具體的稽查實踐中。
一是應用于情報建設、預警響應中。數據節點產生碰撞,說明節點或預設節點曾一次或多次出現在目標數據庫中。對稽查人員來說,情報建設一直以來都是關注的重點和難點,而碰撞分析可以很好地輔助情報的分析和研判。如果收集上來的情報產生碰撞,說明該條情報具備一定的價值;碰撞的節點數越多、產生碰撞的節點越關鍵,情報所反映的事實越接近真相。除此之外,碰撞分析還可以用于違法預警,有效盤活歷史數據。如果已有的數據庫中產生碰撞,說明不同案件、情報之間存在著某種聯系。稽查人員通過分析這些節點,不僅可以挖掘出新的違法線索,還可以串點連線、以案查案,逐步將小案件經營成網絡大案。
二是應用于指揮協調、決策部署中。稽查人員可以通過案發地點的熱點分析來了解和確認“卷煙違法行為高發區域”。結合當地的卷煙銷量、物流分布、人口結構等特征,可以進一步分析違法行為頻繁的原因,并科學地組織人力、物力資源對這一區域進行有目的性的干預。通過對某一時期非法卷煙來源地和流向地的熱點分析,掌握卷煙流動特點,強化對目的地嫌疑車輛和人員的監管,有助于提高違法打擊的精準性。通過對案發時間的熱點分析,得出卷煙違法行為發生的時間規律,加強對節假日、送貨日等特殊時期的市場監管,加強對夜間、清晨等監管盲區的突擊檢查,靈活機動地調整稽查人員的工作重點。
三是應用于案件經營、網絡建設中。關聯分析,有助于稽查人員通過已知的案件和情報信息,摸索新的違法行為規律。有些作案規律是可以憑經驗判斷出的,而有些則需要通過數據論證。比如,稽查人員有時候需要知道案發頻率高峰期集中在哪幾個月份,與這一時期的卷煙投放政策有什么關聯;有時候希望知道哪些零售終端可能出現卷煙違法活動,他們的違法手段和特征有什么不同。再比如,在物流監管中,究竟哪些類型的車輛、哪個地區的車輛是需要重點關注的對象;哪個區域多發生哪些類型案件,與具體的區域特征有什么潛在的聯系等。搞清楚這一條條的規律,就好比是梳理出一條條的脈絡,最終的違法網絡也會逐步呈現。