多年來,我們一直受到安全攝像頭、警察攝像機(jī)、直播視頻、其他人的社交媒體帖子等方式的公開記錄。但是,即使我們的頭上有攝像頭,也不能保證陌生人不會做出任何影響鏡頭的事。如果有人要在幾個月的監(jiān)控錄像中搜索某個特定的人,或者在網(wǎng)上海底撈針般搜索,這是不現(xiàn)實(shí)的,這需要花費(fèi)大量時間和精力。但對機(jī)器人來說卻不是這樣。
好萊塢驚悚片長久以來就已實(shí)現(xiàn)這一點(diǎn),用來識別某人的身份以及他們在視頻和圖像上做何事的工具正在成形。多年來,F(xiàn)acebook和百度等公司一直在研發(fā)這種人工智能技術(shù)。但是,隨著差錯率不斷縮小,以及這些系統(tǒng)使用范圍不斷擴(kuò)大,我們可以預(yù)見到,在不久的將來,每一段視頻都可以用于分析,從而識別出里面的人物、物體和行為。
多年來,人工智能研究人員一直在努力構(gòu)建能夠識別圖像并講述圖像的算法。圖像的復(fù)雜性,每一個都包含數(shù)百萬個像素,形成了獨(dú)特的模式,這對于手工編碼的算法來說太復(fù)雜了。
后來,2012年,研究人員演示了一種叫做深度學(xué)習(xí)的技術(shù),這個系統(tǒng)把我們大腦中相互連接的神經(jīng)元的一般概念轉(zhuǎn)化成數(shù)學(xué)函數(shù),在處理大量圖像時效果會更好。如果系統(tǒng)被調(diào)用的深度神經(jīng)網(wǎng)絡(luò)得到了足夠多的示例,那么它就可以在不同圖像之間找到共享的模式,比如不同貓之間的形狀和紋理。
自那以后,這些系統(tǒng)規(guī)模越來越大,變得越來越復(fù)雜:研究人員開始制造更大的“神經(jīng)元網(wǎng)絡(luò)”,而像英偉達(dá)這樣的硬件制造商則開始打造專門的處理器,讓網(wǎng)絡(luò)的速度更快。其結(jié)果是,系統(tǒng)能夠完成的事情發(fā)生了爆炸式的增長。如果有大量的圖像或視頻資料,這些系統(tǒng)經(jīng)過訓(xùn)練可以來了解一個人的長相,并能一次又一次準(zhǔn)確地識別它。
一個眾所周知的例子是華盛頓大學(xué)的MegaFace。該數(shù)據(jù)集包含了有672,000人的近500萬張圖片,這些圖片來自Flickr的知識共享。今年7月,MegaFace團(tuán)隊(duì)展示了在數(shù)據(jù)集中訓(xùn)練的算法的最新得分。在分別從兩個有100萬張照片的數(shù)據(jù)集中對一個人的兩張人臉照片進(jìn)行配對時,如果給一次機(jī)會,一流團(tuán)隊(duì)的準(zhǔn)確率達(dá)到了75%,而在有十次機(jī)會的情況下,準(zhǔn)確率更是達(dá)到了90%以上。
“我們需要在全球范圍內(nèi)測試面部識別能力,從而實(shí)現(xiàn)實(shí)際應(yīng)用——大規(guī)模測試可以讓你發(fā)現(xiàn)識別算法的缺陷和成功之處,”負(fù)責(zé)MegaFace的華盛頓大學(xué)教授Ira Kemelmacher-Shlizerman在接受華盛頓大學(xué)出版社采訪時表示。
視頻使用類似的技術(shù)來拍攝靜態(tài)圖像,需要更高的處理能力,這也讓人工智能能夠理解隨著時間的推移發(fā)生了什么。百度于2017年8月底宣布,它已經(jīng)贏得了“ActivityNet”挑戰(zhàn)賽,在30萬個視頻中正確地標(biāo)注了人類的行為,準(zhǔn)確率達(dá)到87.6%。這就像砍木頭、擦窗戶和遛狗一樣簡單。
Facebook還表示了對這項(xiàng)技術(shù)的興趣,以了解實(shí)時視頻里有誰,以及他們在做什么。在去年的一次采訪中,應(yīng)用機(jī)器學(xué)習(xí)主管Joaquin Qui onero Candela說,理想情況下,F(xiàn)acebook會了解每一個實(shí)時視頻的情況,以便能夠?yàn)橛脩艄芾韨€性化的視頻頻道。
美國政府已經(jīng)開始在有限的產(chǎn)能中使用這項(xiàng)技術(shù)。上周,紐約機(jī)動車輛管理局宣布,通過面部識別技術(shù),逮捕了4,000多人。該軟件沒有掃描警方的監(jiān)控錄像,而是用來比較新司機(jī)的駕照申請照片和數(shù)據(jù)庫中已有的圖片,讓騙子更難以竊取他人的身份。如果州政府或聯(lián)邦政府在公共場合擴(kuò)大面部識別技術(shù),他們將會擁有一個涵蓋范圍超過50%的美國成年人的數(shù)據(jù)庫。同樣,數(shù)據(jù)集越大,人工智能效果就越好。
而這可能不會太遙遠(yuǎn)。以泰瑟槍聞名的Axon,是美國警察機(jī)構(gòu)最大的相機(jī)經(jīng)銷商。該公司最近加大了將人工智能注入其產(chǎn)品的雄心,今年早些時候收購了兩家人工智能公司。Axon首席執(zhí)行官Rick Smith此前對Quartz網(wǎng)站表示,人工智能的理想用例將是事件報告的客觀生成,讓警方有更多的時間從辦公桌抽身。他指出,面部識別現(xiàn)在并不活躍,但可能會在未來蓬勃發(fā)展。摩托羅拉是另一家重要的隨身攝像機(jī)供應(yīng)商,它的軟件可以通過它快速了解面部表情的能力來進(jìn)行宣傳,突出顯示一名警官正在尋找丟失的孩子的場景。
安全攝像頭也在提升人工智能技術(shù)。英特爾在4月宣布,它已經(jīng)為安全攝像頭生產(chǎn)了硬件,能夠“密集監(jiān)測、立體視覺、人臉識別、計(jì)數(shù)”和“行為分析”。該網(wǎng)站稱,另一款名為DNNCam的相機(jī)是一款深度學(xué)習(xí)攝像頭,它具有防水、自給自足的功能,而且號稱“幾乎不可摧毀”,這意味著它可以在遠(yuǎn)離互聯(lián)網(wǎng)連接的偏遠(yuǎn)環(huán)境中工作,也可以在收銀臺后面進(jìn)行“老客戶識別”。
那么,當(dāng)監(jiān)視成為常態(tài)時,一個注重隱私的、守法的公民該做什么呢?沒有太多可做的。早期的研究已經(jīng)找到了欺騙面部識別軟件的方法,要么是通過特制的眼鏡來欺騙算法,要么是面部涂鴉來欺騙人工智能。但這通常需要了解面部識別算法是如何工作的。(選自:quartz media 翻譯:網(wǎng)易見外智能編譯機(jī)器人 審校:吳曼)