本文就當前環境下,網絡安全與執法專業引入大數據相關課程體系的必要性進行了論述。結合該專業自身特性,對擬引入的大數據相關專業課程提出了選擇建議,同時對擬引入的課程教學內容和其在網絡安全與執法專業的業務應用方向進行了闡述。
引言
隨著互聯網的高速發展,信息技術這把雙刃劍為我國公安部門提出了新的問題和發展方向。一方面,各種網絡犯罪、網絡突發輿情、網絡泄密等危害國家安全和社會穩定的情況對網絡安全與執法提出了更高要求;另一方面,方便快捷的網絡生態又為偵查線索搜集,通緝追逃等傳統手段提供了新的解決思路和方法。為此,我國部分公安院校陸續設立了網絡安全與執法專業。
該專業的培養目標,主要是為公安機關培養網絡安全與執法人才,要求其既懂技術,又會管理和執法。在其專業課程設置上,具有顯著的公安特色,如法律、現場勘察,計算機取證等,同時,在技術層面上,又緊貼計算機及網絡相關專業。要求其學員具備計算機科學與技術、信息安全學科的基本理論和知識,熟悉網絡安全與執法工作的相關法律法規知識,具備網上發現和處置、網上偵查和網上違法違規行為防范和控制的能力,能勝任網絡安全與執法方面的實際業務工作,有能力組織實施網絡信息安全保護,具備搜集互聯網情報信息的手段,有能力完成網絡監管,以及對重要系統的網絡安全監督。
當前,各院校在該專業的技術領域計算機技術方向上,主要偏重于計算機基礎、網絡技術、網絡安全技術等,而大數據技術的發展,為其相關專業課程的引入提出了新的需求。
大數據相關專業課程的設置必要性
傳統的偵查模式基本上是從案到人的偵查模式,而面對現代高智能犯罪、恐怖活動犯罪以及突發性群體事件,傳統的偵查模式不能在事發前就對其進行預防,及時地發現犯罪跡象,對其進行控制和打擊,以避免事態惡化。而現代偵查模式能及早地發現犯罪跡象,進而主動進行偵查,控制局面。大數據技術就是現代偵查模式中的一種,它的引入,為現代偵查帶來了新的機遇,信息數據庫的建立便于全面掌控犯罪信息,大數據技術中的數據分析和智能檢索技術提高了偵查效率,偵查機關也可以利用數據挖掘和預測來進行犯罪預防和控制。世界范圍內,運用大量數據進行犯罪偵查和控制,始于1994年紐約市的警察部門啟用CompStat系統,該系統通過對數據統計報告的各種比較,進行犯罪預防,確定警力資源分配和打擊對策。
大數據(big data),指無法在一定時間范圍內用常規軟件工具進行捕捉、管理和處理的數據集合,是需要新處理模式才能具有更強的決策力、洞察發現力和流程優化能力的海量、高增長率和多樣化的信息資產。大數據技術的意義不在于掌握龐大的數據信息,而在于對這些含有意義的數據進行專業化處理。換而言之,如果把大數據看作一種手段,那么這種手段實現預期目標的的關鍵,在于提高對數據的“加工能力”,通過“加工”實現數據的“增值”。 大數據在西方廣泛應用于商業營銷、群體事件預測、疾控、金融投資分析、精細化教育投放等,也運用于社會監控和預測、治安管理、恐怖主義打擊等等方面。
隨著大數據技術的發展,部分國家開始建立大數據驅動的犯罪偵查和控制體系,該體系利用大數據分析歷史案件、發現犯罪趨勢以及犯罪模式;通過挖掘城市和社交網絡數據,進行犯罪預測;利用大數據優化警力資源分配等。總體來說,利用大數據技術,提升犯罪偵查和控制能力是未來的發展方向。
綜上所述,在網絡安全與執法專業,開設大數據相關課程,是有其必要性和緊迫性的。
大數據方向專業課程體系建設
雖然在網絡安全與執法專業的教學中,引入大數據相關專業課程是有必要性和緊迫性的,但是要全面引入大數據的專業課程,明顯是不現實的,同時,也并無必要。在此,筆者根據網絡安全與執法專業的專業特性和需求,結合大數據相關技術的特點和應用方向,綜合分析研究,推薦選擇以下幾門課程作為網絡安全與執法專業大數據方向的專業課程,形成網絡安全與執法專業大數據方向的專業課程體系。數據挖掘基礎(專業基礎課);多元統計分析(專業課);流式數據處理(專業課);大數據方向專業課程教學內容。
3.1 數據挖掘基礎
數據挖掘是一門新興的交叉性學科,是在信息技術領域迅速興起的計算機技術。數據挖掘技術面向應用,在很多重要的領域,數據挖掘都發揮著積極的作用,是大數據應用的主要手段之一。在犯罪偵查、線索搜集、網絡監管、輿情監控等各個方向上,都有重要的應用。
數據挖掘基礎全面介紹數據挖掘的原理、方法和算法。主要內容包括數據挖掘的基本概念、數據挖掘算法的數據類型、輸入和輸出、決策樹、數據挖掘的預處理和后處理、關聯規則挖掘、分類和回歸算法、支持向量機、聚類分析及多維數據可視化。
該課程作為專業基礎課,通過該課程的學習,使學員了解數據挖掘技術的整體概貌,了解數據挖掘技術的主要應用及當前的研究熱點問題,了解數據挖掘技術的發展方向,掌握最基本的概念、算法原理和技術方法。
3.2 多元統計分析
多元統計分析是從經典統計學中發展起來的一個分支,是一種綜合分析方法,它能夠在多個對象和多個指標互相關聯的情況下分析它們的統計規律,是數理統計學中的一個重要的分支學科。主要內容包括多元正態分布及其抽樣分布、多元正態總體的均值向量和協方差陣的假設檢驗、多元方差分析、直線回歸與相關、多元線性回歸與相關(Ⅰ)和(Ⅱ)、主成分分析與因子分析、判別分析與聚類分析、Shannon信息量及其應用。簡稱多元分析。
多元統計可以處理以下幾類實際問題。
多重回歸分析,簡稱回歸分析。其特點是同時處理多個因變量。回歸系數和常數的計算公式與通常的情況相仿,只是由于因變量不止一個,原來的每個回歸系數在此都成為一個向量。該分析可以通過多個因變量的處理,統計分析某一因變量的變化趨勢。
判別分析,由 k個不同總體的樣本來構造判別函數,利用它來決定新的未知類別的樣品屬于哪一類,這是判別分析所處理的問題。它在網絡安全與執法、偵察各方面都有廣泛的應用。
聚類分析,又稱數值分類。聚類分析和判別分析的區別在于,判別分析是已知有多少類和樣本來自哪一類,需要判別新抽取的樣本是來自哪一類;而聚類分析則既不知有幾類,也不知樣本中每一個來自哪一類。
主成分分析,又稱主分量分析,是將多個變量通過線性變換以選出較少個數重要變量的一種方法。在根據樣本進行主成分分析時又可分為R型分析與Q型分析。前者是用樣本協差陣(或相關陣)的特征向量作為線性函數的系數來求主成分;后者是由樣品之間的內積組成的內積陣來進行類似的處理,其目的是尋找出有代表性的“典型”樣品,這種方法在地質結構的分析中常使用。
其他還有對應分析、因子分析、對應相關分析等。
該課程作為專業課,通過該課程的學習,掌握其各種分析方法,在網絡輿情監控、犯罪偵查、線索搜集、犯罪預防、群體事件輿情事件防控等方面,都有較為廣泛的應用。
3.3 流式數據處理
流式數據處理,指針對流式數據的一種分布式、高可用、低延遲、具有自身容錯性的實時計算技術,它是根據一組規則來動作的工具,通過提取和分析來自各種分布式系統的信息,來解決監控和管理的各種問題。
該課程作為專業課設置,其主要教學內容包括實時數據采集,實時數據處理,實時查詢服務,當前主流流式數據處理產品簡要教學等內容。
流式數據處理技術主要針對數據時效性要求高,原始數據量大,數據量變化迅速,業務生命周期短的大數據應用。其應用特性和網絡安全與執法專業所面對的數據特性具有高度契合性,可廣泛應用于犯罪偵查,實時線索采集,實時追蹤,網絡輿情監管,突發事件防控,治安管理,警力調度,網絡信息采集監管等各個方面。
結語
對于網絡安全與執法專業來說,大數據相關專業體系的引入,對于偵查體系的提升,業務能力的加強,監管手段的豐富,覆蓋面積的加大等各個方面來說,都有其重要的現實意義和緊迫性。同時,對于學員的個人能力提升和知識廣度的擴大,增大學員的就業面,也有其實際作用。但是,當前現狀下,大數據相關專業課程也存在人才儲備不足,師資力量薄弱的問題。相關院校可在條件成熟時,結合自身條件,適時引入大數據相關專業課程體系,建設有特色的網絡安全與執法專業。