將來(lái)也許有一天,任何一個(gè)手機(jī)機(jī)主都能識(shí)別你的身份。比如某天你坐在一個(gè)咖啡館里,眼角余光瞥見(jiàn)一個(gè)陌生人把手機(jī)對(duì)著你的方向,第二天你就收到了一封郵件,發(fā)信人說(shuō)他在咖啡館里偶然看到了你,希望和你約會(huì)。你想破腦袋也不明白他是怎么知道你的郵箱的,更不用說(shuō)他是怎么知道你是誰(shuí)的。
面部識(shí)別技術(shù)正在高速發(fā)展,一系列新的初創(chuàng)公司已經(jīng)涌入了這個(gè)領(lǐng)域,它們常常把“識(shí)別大街上陌生人身份”當(dāng)作一個(gè)廣告噱頭。但在俄羅斯,這已經(jīng)成為了現(xiàn)實(shí)。
兩個(gè)月前,俄羅斯初創(chuàng)公司FindFace推出的一個(gè)應(yīng)用。你想知道某個(gè)路人是誰(shuí)嗎?只要有他的面部照片就行了。FindFace可以把照片和Vkontakte(類(lèi)似于Facebook的俄羅斯社交網(wǎng)絡(luò),簡(jiǎn)稱VK)的個(gè)人資料照片進(jìn)行匹配,從而找到此人的資料。該公司的創(chuàng)始人吹噓說(shuō),這個(gè)應(yīng)用可以幫你“和陌生人建立友誼”。但是很明顯,這里面存在巨大的隱私風(fēng)險(xiǎn)。
這個(gè)應(yīng)用推出之后,很多新聞媒體都提出了這樣一個(gè)問(wèn)題:類(lèi)似的應(yīng)用是否會(huì)在美國(guó)出現(xiàn)嗎?但真正的威脅并不是FindFace這樣的應(yīng)用利用Facebook等社交網(wǎng)絡(luò)的數(shù)據(jù)。真正的問(wèn)題在于,這種應(yīng)用可能會(huì)利用其他數(shù)不清的照片庫(kù)里的數(shù)據(jù),比如學(xué)校檔案、公司員工名單,客戶列表等等。
FindFace的殺傷力
FindFace的工作原理如下:首先,你把某個(gè)陌生人的照片拍下來(lái),將照片上傳到這個(gè)應(yīng)用,然后這個(gè)應(yīng)用就會(huì)在VK里搜索圖片,把它覺(jué)得看起來(lái)很相似的照片發(fā)回給你。 FindFace的面部識(shí)別算法水平是世界一流的,由一個(gè)名為NTech實(shí)驗(yàn)室的公司提供,它最近還在華盛頓大學(xué)參加了一個(gè)國(guó)際大賽,與谷歌的面部識(shí)別算法同臺(tái)競(jìng)技——但這種技術(shù)本身并不新鮮。Facebook每天都在進(jìn)行這樣的搜索,盡管它使用的數(shù)據(jù)集有所不同。FindFace能對(duì)隱私構(gòu)成如此巨大的威脅,真正的創(chuàng)新是在數(shù)據(jù)庫(kù)方面。
當(dāng)你在Facebook上傳照片的時(shí)候,F(xiàn)acebook只會(huì)把照片中的一張張面孔和你朋友的臉進(jìn)行對(duì)比。 但 FindFace就不一樣了,它會(huì)搜索VK上所有的個(gè)人資料照片。VK是俄語(yǔ)世界中人氣最高的社交網(wǎng)站,有數(shù)以億計(jì)的用戶,因此每次有人將照片上傳到FindFace的時(shí)候,F(xiàn)indFace就會(huì)把這張照片和一個(gè)包含了VK所有成員的數(shù)據(jù)庫(kù)進(jìn)行匹配。一旦匹配成功,它就會(huì)找到對(duì)方的VK個(gè)人資料,從而找到名字和聯(lián)系方式。
所有的VK個(gè)人資料圖片都是公開(kāi)的,所以,如果你想不讓這個(gè)數(shù)據(jù)庫(kù)找到你,唯一的辦法就是刪除你的個(gè)人資料。這也就是說(shuō),俄羅斯人只有兩個(gè)選擇,一是離開(kāi)VK,改用一個(gè)比較冷門(mén)的社交網(wǎng)絡(luò),問(wèn)題是這樣你就看不到VK上朋友的各種更新、照片和消息了。另外一個(gè)選擇就是認(rèn)命,任由別人把你的臉編入索引,進(jìn)行搜索。
FindFace的數(shù)據(jù)庫(kù)極有可能是用爬蟲(chóng)從VK抓取的,或者通過(guò)該公司的應(yīng)用編程接口API逐一下載的。對(duì)于Facebook、Twitter和谷歌這樣的大型網(wǎng)站來(lái)說(shuō),這種抓取數(shù)據(jù)的行為著實(shí)令人惱火,所以這些網(wǎng)站會(huì)在服務(wù)條款中禁止“自動(dòng)收集數(shù)據(jù)”,它們還加強(qiáng)了隱私設(shè)置,采取了有力的保護(hù)措施,如果你加載頁(yè)面的速度太快,數(shù)量太多(這種行為很像是爬蟲(chóng)),這些網(wǎng)站就會(huì)自動(dòng)限制或切斷你的訪問(wèn)。
Facebook可以采取的對(duì)策
這并不意味著Facebook非常安全。在Facebook上,你無(wú)法向陌生人隱藏自己個(gè)人資料,而這本來(lái)應(yīng)該是抵擋FindFace抓取資料的一道基本防線。最起碼,F(xiàn)acebook用戶應(yīng)該可以向朋友顯示一張照片,向陌生人顯示另外一張照片。如果有需要,F(xiàn)acebook用戶還應(yīng)該可以把這幅照片的分辨率降低到一定程度,給FindFace的面部識(shí)別算法制造障礙。此外,F(xiàn)acebook甚至應(yīng)該提供降低照片灰度、進(jìn)行模糊處理的功能,進(jìn)一步阻斷面部識(shí)別技術(shù)所需要的信息。
Facebook還有能力提供另外一個(gè)強(qiáng)大的隱私功能。它可以使用自己的面部識(shí)別功能,看看其他人的個(gè)人資料照片是否和你的很相似(你是否在Facebook上有一個(gè)“雙胞胎”)。如果是這樣,F(xiàn)indFace的算法就比較難以精確識(shí)別你了。如果你的長(zhǎng)相確實(shí)獨(dú)一無(wú)二,F(xiàn)acebook就需要把你的照片進(jìn)行模糊處理,降低你照片的分辨率。
Facebook之所以有能力提供這樣一些隱私保護(hù)措施,根源在于它不是一個(gè)開(kāi)放的網(wǎng)站,而是一個(gè)有圍墻的花園。它能夠控制個(gè)人資料圖片這樣的內(nèi)容,獲得這些內(nèi)容的唯一辦法就是必須遵守Facebook的規(guī)則,接受它在速率等方面的限制。不幸的是,互聯(lián)網(wǎng)上有大量的圖片不在任何人的控制之下。
谷歌還會(huì)按兵不動(dòng)嗎?
在谷歌上搜一下自己的名字試試,說(shuō)不定會(huì)看到熟悉的面孔。谷歌并沒(méi)有悄悄地從Facebook抓取這些圖片,它的爬蟲(chóng)大軍在數(shù)以百萬(wàn)計(jì)的公共網(wǎng)站上收集圖片,把它們鏈接到頁(yè)面的關(guān)鍵字上,其中也包括你的名字在內(nèi)。由于這些爬蟲(chóng)從很多不同的地方抓取信息,每個(gè)地方都只抓一點(diǎn)點(diǎn),所以沒(méi)有任何一個(gè)網(wǎng)站有必要像Facebook限制爬蟲(chóng)訪問(wèn)那樣限制谷歌。事實(shí)上,大多數(shù)網(wǎng)站都對(duì)谷歌的爬蟲(chóng)青眼有加,因?yàn)檫@樣一來(lái),自己的內(nèi)容才能在谷歌上被搜到。
目前,你搜索圖片的主要方法是使用描述圖片的關(guān)鍵字。在谷歌上,你確實(shí)可以用圖片來(lái)搜索圖片,但這個(gè)過(guò)程并不涉及面部識(shí)別技術(shù)——在谷歌上,你無(wú)法像在FindFace上那樣搜索相似的面孔。事實(shí)上,谷歌執(zhí)行董事長(zhǎng)埃里克·施密特提到面部識(shí)別技術(shù)時(shí)說(shuō)過(guò),這是“唯一一個(gè)谷歌已經(jīng)實(shí)現(xiàn),但是在考慮了一陣之后,我們決定停止開(kāi)發(fā)的技術(shù)。”
但是抓取網(wǎng)頁(yè)、建立一個(gè)照片數(shù)據(jù)庫(kù),這并不是谷歌大型搜索引擎獨(dú)享的領(lǐng)地。雖然從目前來(lái)看,要在全網(wǎng)級(jí)別上模仿FindFace仍然缺乏技術(shù)上的可行性,但很可能在不久的將來(lái),這就會(huì)成為現(xiàn)實(shí)。NIST的專家說(shuō),面部識(shí)別技術(shù)正在突飛猛進(jìn),存儲(chǔ)和處理的成本也在日益下降。如果一家創(chuàng)業(yè)公司的道德感沒(méi)那么強(qiáng),寫(xiě)一個(gè)網(wǎng)絡(luò)爬蟲(chóng),建立一個(gè)數(shù)據(jù)庫(kù),推出一個(gè)互聯(lián)網(wǎng)級(jí)別的面部識(shí)別搜索引擎(谷歌至今不愿這么做)并不是難如登天的事情。如果這個(gè)功能成為了未來(lái)社交媒體的必備功能,那么像谷歌這樣的公司還會(huì)繼續(xù)按兵不動(dòng)嗎?
無(wú)所遁形的世界
互聯(lián)網(wǎng)不會(huì)在一夜之間變成一個(gè)巨大的面部識(shí)別數(shù)據(jù)庫(kù),但是這種技術(shù)已經(jīng)有人在小范圍內(nèi)使用了。 2011年,卡內(nèi)基·梅隆大學(xué)的教授亞歷山德羅·艾奎斯提(Alessandro Acquisti)下載了該校在Facebook上的每個(gè)成員的個(gè)人資料照片,然后用志愿者的網(wǎng)絡(luò)攝像頭照片來(lái)進(jìn)行匹配。他發(fā)現(xiàn),采用這種方式,可以識(shí)別出幾乎三分之一的志愿者的身份,找到他們的Facebook個(gè)人主頁(yè)。那已經(jīng)是五年之前的事了,如今這種技術(shù)的成功率肯定會(huì)比當(dāng)時(shí)高得多。 (當(dāng)然這幾年來(lái)Facebook也加強(qiáng)了保護(hù)措施。)
在公司、大學(xué)或城市這樣的級(jí)別上,F(xiàn)indFace之類(lèi)的應(yīng)用確實(shí)可以讓你無(wú)可遁形。這些在線目錄和數(shù)據(jù)庫(kù)的條目數(shù)量在十萬(wàn)以內(nèi),可能不會(huì)觸發(fā)反爬蟲(chóng)措施,眼下它們就是面部識(shí)別技術(shù)可以利用的寶庫(kù)。
這聽(tīng)起來(lái)似乎有點(diǎn)遙遠(yuǎn),但俄羅斯VK用戶現(xiàn)在面對(duì)的兩難困境有可能降臨在每個(gè)人頭上。直接刪除網(wǎng)上的個(gè)人資料并不是小事一樁。而且網(wǎng)上有很多照片是別人在我們不知情的情況下上傳的。比如你參加了社區(qū)的游泳賽,主辦方?jīng)]有知會(huì)你們就直接把比賽照片貼在了網(wǎng)上……
也許有一天,匿名時(shí)代將會(huì)終結(jié)。你不再是人群中一張無(wú)法辨認(rèn)的面孔,網(wǎng)絡(luò)世界中永遠(yuǎn)不會(huì)再有你的藏身之所。