斯諾登泄密各種美國國安局(NSA)的“黑科技”之后,米國人民似乎意識到了無論什么樣的通信方式都逃不過來自政府的監控,NSA甚至早在40年前就可以識別語音了。
語音識別技術可追溯到20世紀70年代
要想更好的理解這是怎么一回事,就要追溯到20世紀70年代:當時美國國防高級研究計劃局(DARPA)首次出資研究語音識別技術,在此階段有好幾個項目都可以將語音轉換成文本格式。盡管當時的進程很緩慢,但是,通過技術的不斷提升,識別的進程變得越來越快,獲得的數據也越來越多。
DARPA信息創新辦公室主任Dan Kaufman稱:
將語音轉換成文本的方法是非常困難的,因為通話中往往會有很多其他的噪音信號干擾,我們不是很擅長排除這類的干擾,但是我們也正在慢慢的擅長翻譯這些信息。
2001年之后,對間諜工具投入的資本有了顯著的增加,從斯諾登文件中甚至可以發現,十年前NSA分析師對“Google for Voice”的誕生是非常開心的。
然而任何工具都不能做到完美的翻譯語音對話,至少現在還沒有這樣的工具;但是不可否認的是當前的一些工具著實很強大,通過大范圍的關鍵詞搜索、提取語音對話信息、使用算法標記對話等方式使得翻譯更加的準確。
斯諾登文件還指出,美國情報中心已經在一些戰區(如,伊拉克、阿富汗、拉丁美洲)使用這種工具進行監聽了,但是他們卻不會監聽美國公民的通話信息。也許全球的公民都應該保持警惕了,因為美國情報機構是使用雷達進行活動的,就連美國國會也覺察不到他們的活動。
語音轉換工具及其發展史
2001年爆發的一次恐怖分子攻擊活動,攻擊者就是用類似的工具,以自動化的方式搜集到了大量的語音通信數據。
第一代語音轉化工具:RHINEHART
第一代工具叫做“RHINEHART”,首次出現在2004年。NSA一個叫做For Media Mining, the Future Is Now!的內部文件(2006年)中指出:
語音搜索技術可以幫助分析師快速的查找情報內容,并能根據情報內容優先攔截部分通話。RHINEHART同時支持實時搜索和回顧搜索,這樣一來分析師們即可查到當前的通信信息,還可以查到過去的通信信息。
2006年的時候RHINEHART就能夠在多種語言中進行翻譯了。其中西班牙語在轉換中的準確率最高。
第二代語音轉化工具:VoiceRT
2009年,VoiceRT開始出現,首次用在巴格達地區,它的目標是每天能檢索并標記100萬份信息。
第三代語音轉化工具:SPIRITFIRE
在2011-2012年間又出現了一個新工具,叫做“SPIRITFIRE”。它能處理更多的數據,并且速度更快,在語音-文本的關鍵字搜索和配對對話轉錄功能基礎之上擁有更加穩健的語音處理能力。
作為一個普通的公民,我們希望相關機構充分尊重我們的權利,嚴格管理這類工具,并立法保護我們的隱私。