有人看過電視劇《犯罪心理》么?我最感興趣的是來自聯邦調查局行為調查支援科的特工們是如何對幾乎沒有任何具體信息的不明身份嫌疑犯(聯邦調查局官方說法叫未知項目)進行心理分析的。
我最喜歡的劇中人物就是負責包括筆跡學和書面文件取證分析在內的重要任務斯賓塞·里德博士。僅僅通過閱讀信中的只言片語,他就可以描繪出作者的基本信息。
匿名郵件暴漲
盡管,這類人員依然很重要。但是,我們已經進入了數字時代。越來越多的書面信息已經電子化。這讓執法人員的工作變得更加困難,尤其是針對不明身份嫌疑犯的時間(抱歉,我不能帶來幫助)。
最近,我就見識了兩位來自康考迪亞大學的共同研究者本杰明·馮教授(數據挖掘專家)和穆拉德·德巴比教授(網絡法證專家)的出色工作。他們研究的項目是匿名數字郵件,尤其是電子郵件的去神秘化。
我詢問馮教授他對匿名郵件的定義是什么:“一封電子郵件包含了兩個部分,郵件頭和郵件主體。‘匿名郵件’就是沒有頭信息的電子郵件,并且,可以預料到在郵件結尾的地方也沒有名字或者數字簽名。”
他進一步補充說,“在過去的幾年里,我們已經認識到涉及網絡犯罪的匿名郵件呈現出爆炸性增長的態勢。這些電子郵件可以被用來進行威脅,發送兒童色情制品,協助犯罪分子進行溝通或者傳遞病毒。”
深入了解電子郵件
對于電子郵件取證來說,一種新方法可以用來確認作者;在一份文件中,研究團隊指出了電子郵件特別容易被誤用的原因,內容如下所示:
對于欺詐類電子郵件來說,郵件頭中包含發件人信息的元數據以及信息路徑都可能是偽造的。
發件人可以通過匿名郵件服務器發送電子郵件,以隱瞞其實際發送地址。
電子郵件系統具備傳輸可執行文件、超鏈接、木馬和腳本的能力。
可以通過網吧和圖書館之類的公共場合連接互聯網電子郵件服務,讓匿名問題的處理進一步復雜化了。
好吧,現在我們知道了問題是什么以及它是如何出現的?,F在就讓我們用犯罪心理給出的分析模式,來看看為了將匿名信息清晰化需要進行何種處理。
電子指紋的出現
在現實世界中的法證領域,可以利用指紋來識別個人。而在匿名電子郵件的案件中,研究人員利用撰寫者身份參數來建立被調查個體(不明身份嫌疑犯)的“字紋”檔案。這里的書面內容包含了:
詞匯豐富度
語句長度
功能詞使用頻率
段落布局情況
我沒有意識到的情況出現了:作品風格學已經發展到可以利用軟件進行分析的階段了。簽名就是一個典型的例子。
新方法的特征
馮教授和德巴比教授在撰寫者身份參數方面的研究則更為深入。他們將語音識別和數據挖掘過程中使用的數字技術綜合到一起。這樣就可以讓研究團隊確認電子郵件的重復模式。
馮教授解釋道:
舉例來說,匿名郵件中包含了錯別字,語法錯誤或者是大小寫方面的問題。我們就利用這些特殊之處建立一個字紋。
利用這種模式,我們可以對特定電子郵件的撰寫者進行高精度預測,可以推斷其性別、國籍和教育程度等情況。
下面給出的圖片,就是教授們提供的,展示出該模式是如何進行工作的(感謝愛思唯爾):
我們首先從S1號嫌疑人撰寫的E1號電子郵件中獨立提取活動模式參數。盡管現在的活動模式參數中包含了S1號嫌疑人的寫作風格,但利用所有的活躍模式為其建立字紋也是不恰當的,原因在于,S2號嫌疑人和S3號嫌疑人也可能與S1號嫌疑人具有某些相同的寫作模式。
因此,問題的關鍵就變成了篩選出共同的活動模式,并分離出可以用于從其它嫌疑人的寫作風格中區分出來的獨特模式。這些獨特模式就構成了嫌疑人的字紋。
在這里,我想與廣大讀者一起分享從兩位教授文章中發現的有趣內容:
活動模式挖掘已經在基因測序、消費者購買習慣分析、安全入侵研究和很多其它模式的識別應用中被證明屬于成功的數據挖掘技術。但據我們所知,這是第一篇介紹利用活動模式概念確認撰寫者身份參數內容的論文。
理論檢驗
為了對技術的準確性進行測試,研究人員選擇了一個包含158名撰寫者的20萬封實際電子郵件的數據庫作為樣本。在針對10封不同主題的電子郵件進行測試后。研究人員發現準確程度可以達到80%到90%。
馮教授聲稱,“我們的技術是設計用來為法庭提供可靠證據支持的。為了保證證據被采納,調查人員需要解釋如何得出相關結論。而我們的模式就可以支持他們進行相應的處理。”
下面就是為什么該模式可以在法庭上使用的專業原因:
可以用于確認嫌疑人的字紋。
可以用于確認惡意電子郵件的作者。
能夠提供證據支持確認撰寫者的結論。
最后的思考
從一開始,研究團隊關注的就是如何向法庭提供有效的證據表明犯罪分子就是匿名者。我想他們的努力方向是正確的。