隨著人工智能的發(fā)展,不會(huì)調(diào)教AI的其他工種都有著被AI取代的風(fēng)險(xiǎn),為了讓寶寶們贏在起跑線,玩具熊、玩具狗、玩具人都推出了“人工智能”版本,成為擁有語音對(duì)話功能的高等機(jī)器生物。然而,且不說這些玩具究竟有多智能,看似傻乎乎的娃娃們,其實(shí)埋藏著深深的隱私完全問題。
近日,電子隱私信息中心、消費(fèi)者聯(lián)盟、電子民主中心等多個(gè)非營(yíng)利性組織向美國(guó)聯(lián)邦貿(mào)易管理委員會(huì)上訴,多款兒童語音玩具未經(jīng)同意或提示,收集語音數(shù)據(jù)。通過藍(lán)牙和用戶手機(jī)app,將語音數(shù)據(jù)轉(zhuǎn)成文字傳輸?shù)焦雀杌蛘逳uance的服務(wù)器上。由于法律規(guī)定未成年的隱私數(shù)據(jù)信息采集必須獲得家長(zhǎng)的同意,并且監(jiān)護(hù)人需擁有檢查和刪除信息的權(quán)利,這些看似無害的語音采集,實(shí)為極其嚴(yán)重的侵權(quán)。
銷量超過百萬的互動(dòng)娃娃:My Friend Cayla
其實(shí),隱私安全問題之所以可怕,就是因?yàn)榫W(wǎng)絡(luò)時(shí)代的信息收集無所不在。在人們開始擔(dān)心玩具在傳輸小主人的語音信息之前,段子手或者爸媽的朋友圈早就對(duì)網(wǎng)絡(luò)公司們收集追蹤用戶活動(dòng)狀態(tài)多年的惡性諸多不滿。而當(dāng)聽說那些逐漸成為家電潮流的真正的AI助手們,居然無時(shí)無刻不在監(jiān)聽的時(shí)候,對(duì)人工智能的恐懼感更是與日俱增。
對(duì)于AI語音助手來說,收集人的語音、分析對(duì)話、采集數(shù)據(jù)是它們得以正常工作的基礎(chǔ),但是不明真相的群眾在沒有足夠的知情權(quán)之前,聽說家里的AI助理其實(shí)可能無時(shí)無刻不在偷聽,的確有種“小音響其實(shí)是黑客帝國(guó)派來的臥底”既視感。
語音助理:你說的我都聽
Amazon Echo和Google Home是目前北美市場(chǎng)上最受歡迎的兩款語音助理,每當(dāng)主人喊出Alexa或者google的大名,它們就會(huì)隨即記錄下人類的語音,并將這些語音文件傳輸?shù)竭h(yuǎn)程的服務(wù)器中,通過AI“大腦”的處理,給出相應(yīng)的回答。同時(shí),人類的回答會(huì)自動(dòng)儲(chǔ)存在個(gè)人的賬戶下面。
Amazon Echo / Google Home
對(duì)應(yīng)被記錄下來的語音,系統(tǒng)也會(huì)自動(dòng)記錄AI的回答,從一次次的對(duì)比中,逐漸掌握主人的習(xí)慣、不同的口音等。對(duì)于家庭語音助手來說,個(gè)人化的專屬體驗(yàn)是她希望達(dá)成的未來,通過對(duì)一個(gè)賬號(hào)的行為分析,更好地為一個(gè)家庭提供個(gè)性化的私人服務(wù),使得記錄個(gè)人的歷史變得十分必要。
由于需要遠(yuǎn)程傳輸處理,語音助理必須在有Wifi的環(huán)境下才能工作,同時(shí)為了防止干擾語音阻礙語音助理的學(xué)習(xí),只有在說出喚醒詞,比如Alexa或者Google的名字時(shí),才會(huì)處于信息傳輸被激活的狀態(tài)。
為了能夠讓語音助理準(zhǔn)確捕捉到喚醒詞,在被喚醒前,它們依舊處于“監(jiān)聽”狀態(tài),只是此時(shí)語音助理聽到的片段,都不會(huì)被傳到處理器上記錄下來,只是時(shí)時(shí)處于備戰(zhàn)狀態(tài),等待喚醒詞的激活。
其實(shí),它的原理和一些照相機(jī)的連拍模式比較相似,相機(jī)會(huì)在完全按下快門連拍之前,先捕捉幾張畫面,以保證不會(huì)因?yàn)榘聪驴扉T的手指動(dòng)作遲緩而漏掉畫面。對(duì)于語音助理來說,為了保證它隨時(shí)處于不用按鍵就能夠通過語音操作的便捷性,就必須在激活前一直處在你說我聽的模式。
如果強(qiáng)行通過靜音鍵關(guān)掉麥克風(fēng),那么語音助理基本上就處在“罷工狀態(tài)”,只能每次要用的時(shí)候,關(guān)掉靜音鍵,再重新捕捉關(guān)鍵詞使用,很大程度上,就失去了便捷的語音啟動(dòng)的意義。語音助手也會(huì)每次在開啟的時(shí)候提醒你,要打開靜音鍵才能享受完全的服務(wù)。
可以刪掉的黑歷史
雖然,科技公司們的確可以追溯用戶的操作、儲(chǔ)存記錄,但是,對(duì)于特別在意隱私的人來說,這些賬戶大部分還是允許用戶自行刪除記錄的。
比如,如果對(duì)Alexa說了太多不可描述的黑話,用戶有可以直接在app的設(shè)置中找到這些被記錄下來的語音歷史。同樣的谷歌賬號(hào)也提供包括了谷歌搜索、YouTube視頻記錄、安卓App記錄,Google Home的語音記錄等一系列賬號(hào)歷史操作。不過雖然人肉刪除了記錄,但后臺(tái)服務(wù)器上的資料是否也會(huì)被一并刪除,就不得而知了。
每個(gè)程序都有bug,每種系統(tǒng)都有被黑的可能,但亞馬遜和谷歌的防護(hù)還是很到位的,從家里的語音助理到數(shù)據(jù)中心的路徑必然是加密的,即使家庭的網(wǎng)絡(luò)遭到破解,Amazon Echo和Google Home直接被侵入的可能性也極低。整個(gè)語音助理最容易出問題的環(huán)節(jié),其實(shí)是賬號(hào)密碼被破解,導(dǎo)致操作隱私被暴露。
但是,不是每一種AI都可以刪掉黑歷史的,以Siri為例,她在將所有的對(duì)話送回云端之后,一方面,不向用戶提供查閱對(duì)話歷史的功能,同時(shí),系統(tǒng)會(huì)在六個(gè)月之后,將對(duì)話與賬戶之間的關(guān)系脫鉤,只是將語音資料作為數(shù)據(jù)庫的一份子。
AI的隱私安全
蘋果在6月的WWDC上發(fā)布了Differential Privacy(差分隱私)算法,加入虛擬數(shù)據(jù),讓人幾乎無法辨別出數(shù)據(jù)的來源和個(gè)人信息。雖然,這種算法大規(guī)模使用的可行性還未可知,但是,隱私安全的保護(hù),的確是市場(chǎng)人工智能面臨的重要問題之一。
2016WWDC,蘋果軟件工程高級(jí)副總裁 Carig Federighi
顯然,并不是每一個(gè)從業(yè)者都認(rèn)識(shí)到了這個(gè)問題,類似“智能”娃娃這樣沒有獲得允許,就隨意收集并出賣用戶隱私的行為,讓人懷疑這樣的娃娃,類似的AI功能和產(chǎn)品,是不是還存在著更多的安全漏洞。