這些年來,隨著技術手段的不斷提升,想要竊取財富的黑客以及他們不斷更新的黑客手段也讓網絡安全事件數量持續飆漲。
有研究指出,數據泄露事件造成的損失平均在386萬美元,而且有30%的幾率會在未來2年再次發生。其中,監管嚴格的健康醫療和金融領域的損失最為慘重,平均損失分別在人均408美元和206美元,遠高于整體水平(148美元)。
了解網絡安全的現狀,識別造成安全隱患的可預測的因素,對于保護個人及公司的隱私數據和信息至關重要。所以,我爬取了一些黑客攻擊數據,希望利用數據科學的方法做一些有價值的分析。
我首先使用爬蟲先爬取了hackmageddon.com網站上列出的網絡攻擊事件,發現式數據分析來找出其中的趨勢。然后我使用爬蟲爬取了 glassdoor.com ,收集受到網絡攻擊事件影響的健康醫療領域公司的信息,最后進行數據分析和數據可視化。
我使用編程語言是Python,調用了numpy、pandas、seaborn、scrapy、matplotlib、詞云以及神經語言等程序包。
在網絡攻擊事件方面,我收集了日期、攻擊目標、目標等級、國家、攻擊情況簡介以及攻擊類型。公司信息方面,我收集了公司的營收情況、員工數量。在分析時我使用了數據可視化以及詞云等方法來更直觀展現我發現的規律。
首先我們先看一下網絡攻擊的現狀。
與去年相比,今年每個月的網絡攻擊數量都有上升
而在攻擊目標方面,個人是最多的攻擊對象。2017年有61起個人攻擊事件,今年已經又169起。緊隨其后的是健康醫療領域和金融領域的公司。其他像是科學、交通或者服務業等受影響較小。
下面的餅圖顯示了攻擊的類型。超過一半的針對個人的攻擊屬于惡意軟件類型,其次是劫持以及針對性的攻擊。不過,盡管位列最令人擔心的前5類攻擊,但瞄準轉賬行為進行攻擊以竊取信用卡信息的惡意軟件攻擊并不占主導。其他還包括惡意廣告、漏洞攻擊以及惡意腳本。
為了進一步了解針對個人的攻擊的本質,我對這些攻擊的描述文字進行處理和數據清洗后以詞云形式呈現。出現較頻繁的詞是百萬、事件、安卓和應用(app)。說明一些攻擊常常在安卓用戶下載app時出現,并同時影響數百萬人。勒索軟件的頻率也在提高,這種攻擊會遠程鎖住你手機的部分功能,讓你無法獲取自己的重要信息。
除了安卓系統外,醫療健康行業也是黑客最喜歡的攻擊對象。
下圖是醫療健康行業的網絡攻擊事件詞云。與針對個人的明顯不同。網絡釣魚、電子郵件帳戶以及員工成為最常出現的詞。說明在針對醫療健康機構的攻擊中,黑客往往通過釣魚軟件攻破員工的電郵賬號進而獲取整個系統的權限,之后竊取信息。
這讓我思考一個問題,機構的員工數是否與它受攻擊數成正比,因為越多的員工可能安全隱患也越大。
我將受影響的機構分成醫院、私人公司(大多數是某些專癥診所)以及非營利組織(比如大的醫院集團和醫療保險公司)三類。
(圖片說明:從上到下分別是非營利組織、私人公司和醫院類)
非營利組織類別中,網絡攻擊數隨組織規模增長而增多。大約30%的攻擊發生在擁有超過1萬雇員的機構。而比較意外的是,私人公司類別中,呈現了相反的趨勢。雇員增長而攻擊數下降。人數在50人以下的公司受到的攻擊數最多,說明他們在網絡安全方面缺乏投入。而醫院類別方面,沒有明顯的趨勢。超過一半的攻擊針對的是1000到5000人的醫院,也許這是因為這樣的規模是所有醫院的平均水平,而更大或更小規模的醫院已經被我歸入其他兩個類別中了。醫院看起來最容易受到攻擊。
最后,總結一下我比較重要的發現:
2018年每月的網絡攻擊事件都比上一年有所增長
惡意軟件和劫持類的攻擊行為的對象多為個人
黑客往往同時瞄準大批用戶,以安卓用戶為主
受影響最大的產業是醫療健康領域
黑客用郵件方式攻擊雇員的賬戶
醫院陳舊的IT系統以及眾多的雇員讓他們在攻擊面前很脆弱
小的私人機構由于缺少高級網絡安全團隊兒更加脆弱
網絡攻擊威脅著每一個連上互聯網的個人和公司。如果你是使用安卓的用戶,下載app時小心一點可以有效防范攻擊。對于醫院等組織,我們建議應該提高網絡安全培訓,提高大家的意識。勒索軟件正成為黑客們常用的手段,這需要所有行業加大在網絡安全領域的投入來做出應對。
無監督機器學習可以用來將各類公司分成風險水平不同的多個種類,從而幫助監測攻擊并且根據公司的不同特點來更好地預防攻擊。未來深度學習將是識別未知來源網絡攻擊的另一個強力武器。它不僅識別攻擊,而且可以在下一次攻擊前提前做出應對。