知道嗎? 你看到的互聯網, 只有全部互聯網的4%, 而DARPA正在開展一個雄心勃勃的項目,圍繞的搜索為中心, 向人們展示剩下的96%的互聯網內容。
這個項目名為Memex, 是由美國國防部高級研究項目暑(DARPA)發起的一項研究項目, 由DARPA挑頭,?。保讣覇挝粎⑴c此項目, 包括NASA。
“這個項目將會帶來巨大的影響。” NASA負責Memex項目的首席研究員Chris Mattmann說。
Memex將會像社交媒體一樣研究用戶的聊天數據, 將會把各類不同的數據根據關系關聯起來, 使得用戶能夠更容易地找到他們想要的東西。
DARPA啟動這個項目的初衷, 是想來收集類似暗網這樣的P2P網絡里的數據, 希望藉此來打擊人口販賣等犯罪活動。
“對于執法部門來說, 這個一個前所未有的工具。“ Chris Mattmann說道:”Memex已經在執法部門里開始使用了。這其中包括紐約縣地區檢察長辦公室。
搜索暗網
“Memex目前專注于在暗網中發現那些不法行為。” Chris Mattmann介紹道。
暗網中的有些部分可以幫助人們繞過一些國家的政府檢查, Memex不關心這些部分。 Memex的目的不是讓互聯網“去匿名化”。
與此同時, 暗網也是各種不法活動的天堂, 包括人口販賣, 毒品交易, 武器交易, 兒童色情, 雇傭殺人, 以及黑客活動。 這部分的互聯網是目前執法部門執法的薄弱環節,因為傳統的搜索引擎無法收錄這些網絡里的信息。 而Memex可以改變這種狀況。 DARPA網站上聲稱通過對暗網內容的收錄, 將有機會發現并且打擊人口販賣組織。
Memex的設計有兩個重要的特點, 第一是能夠從極小的像素中推斷出圖形的含義。 第二是能夠搜索圖像和視頻的元數據。 這些元數據很多情況下對于現有的搜索引擎來說是不可見的。 ”元數據非常重要, 元數據能夠描述圖片和視頻, 從而使得我們找到它們之間的聯系“ Chris Mattmann說道。
Memex可以在現有的暗網瀏覽器或瀏覽工具的基礎上, 把圖像和人的關系建立起來。
利用這些, 執法部門就可以判斷一副圖片或者視頻是否是用同一臺設備拍攝的。 以及有哪些其他圖片或者視頻是同一個人拍攝的等等。 它們還可以把毒品和毒品販子關聯起來。 盡管很多社交網站已經在開始收集圖片的元數據,比如圖片拍攝的地點等。 但是Mattmann說:”那些壞人通常都不會使用這些社交平臺。”
新的互聯網
不過Mattmann真正感到興奮的不是Memex被執法部門采用, 而是Memex最終會被廣大普通用戶所使用。 他加入Memex項目的目的是他認為“很多政府投資在DARPA的技術將最終變成成功的民用項目”。 事實上, Internet也正是從DARPA的ARPANET脫胎而生的。
Memex的部分代碼已經開源, 這也就意味著人們可以自由的下載和使用了。
作為Apache項目的志愿者委員會成員, Mattmann對把Memex的技術帶給類似Apache這樣的開源項目很感興趣。 而Apache也已經開始在使用Memex。 Apache的服務器大約占了Internet服務器的53%, 而Drupal和Google也已經開始在采用Memex的代碼。
Mattmann說, 用戶很快就會感覺到, 信息會更容易被搜到, 而且搜索結果也會變得更加語義相關。 特別是在進行多媒體內容的搜索時。
根據DARPA網站上所指出的, 現有的搜索引擎的一個主要問題, 是”它們采用了中心化的, 對所有的搜索請求采用同一方法和同樣的工具進行處理。 ” “現有的模式依然是一個嚴重依靠手工的過程, 這樣的過程并不存儲會話, 嚴格要求每次一個輸入, 而且對返回的結果除了給出鏈接列表之外, 并不做進一步的整合和組織。“ DARPA指出”盡管現有的模式在被大量使用, 但是在很多政府的用例中并不適用。“
當然, 新的互聯網并不會是完全替代現有的互聯網, 而是會逐步整合進現有的互聯網。 而這一整合已經開始了。 Mattmann說:‘在今后一兩年內, 我們將會看到采用Memex的互聯網“, 就像APRANET孕育了Internet一樣, Mattmann認為“ Memex對于搜索的影響就像ARPANET對于Internet的影響那樣。”