前言
據(jù)wired報(bào)道,谷歌將發(fā)布一個(gè)名為Private Join and Compute的開(kāi)源加密工具。它有助于連接來(lái)自不同數(shù)據(jù)集的數(shù)字列,以計(jì)算在整個(gè)數(shù)學(xué)過(guò)程中加密和不可讀數(shù)據(jù)的總和,計(jì)數(shù)或平均值。只有計(jì)算結(jié)果才能被所有各方解密和查看,這意味著你只能獲得結(jié)果,而不能獲得你未擁有的數(shù)據(jù)。該工具的加密原理可以追溯到20世紀(jì)70年代和90年代,但谷歌已經(jīng)重新利用并更新它們,以便與當(dāng)今功能更強(qiáng)大、更靈活的處理器配合使用。
既可以分析數(shù)據(jù),又不擔(dān)心數(shù)據(jù)的泄漏,有這樣的好事嗎?
這么多年來(lái),個(gè)人隱私數(shù)據(jù)的事件不但發(fā)生,屢禁不止,就其根源,很大程度上是因?yàn)橛腥艘眠@些大數(shù)據(jù)對(duì)用戶(hù)的各種行為習(xí)慣進(jìn)行分析。只要這個(gè)動(dòng)機(jī)存在,用戶(hù)的隱私泄漏就不會(huì)停止。
現(xiàn)在,經(jīng)過(guò)多年的研究,谷歌的密碼學(xué)家和數(shù)據(jù)科學(xué)家提出了一種既可以分析數(shù)據(jù),又不擔(dān)心數(shù)據(jù)泄漏的技術(shù),這種技術(shù)的實(shí)現(xiàn)原理就是安全多方計(jì)算。
何為安全多方計(jì)算?
為了了解安全多方計(jì)算,讓我們先看兩個(gè)使用場(chǎng)景
(1)某所高校為了讓學(xué)生的飲食更加健康,就想把食堂的后臺(tái)服務(wù)器中每個(gè)學(xué)生的就餐記錄和他們?cè)谝欢螘r(shí)間內(nèi)的就醫(yī)記錄相比較,進(jìn)而改進(jìn)食堂的食譜,讓學(xué)生更健康。但很明顯,醫(yī)院也是希望通過(guò)學(xué)校的食堂,改進(jìn)學(xué)生的體質(zhì),但很明顯,雙方是不可能向?qū)Ψ酵嘎蹲约旱臄?shù)據(jù)的,甚至是“信任”的第三方,那么他們?nèi)绾卧诒Wo(hù)數(shù)據(jù)私密性的前提下合作項(xiàng)目呢?
(2)你懷疑自己得了某種遺傳疾病,想驗(yàn)證自己的想法。于是你找了一家可以做基因疾病鑒別的醫(yī)院,不過(guò)前提是,你需要通過(guò)朋友A,幫你把你的DNA樣本送到醫(yī)院。等到醫(yī)院鑒定完畢,醫(yī)院再把結(jié)果交給A,最后由A把結(jié)果轉(zhuǎn)交給你。所以,你就擔(dān)心A是不是可信,會(huì)不會(huì)偷偷地獲取你的信息,因?yàn)槟闩逻@樣一來(lái),你的相關(guān)私人信息就全部暴露了。
以上2個(gè)例子都有一些共同的特點(diǎn):
1.所有的信息都是隱私的;
2.不想第三方甚至是合作方泄露自己的隱私數(shù)據(jù);
3.在保護(hù)數(shù)據(jù)隱私的前提下,又企圖達(dá)到“數(shù)據(jù)共享”應(yīng)該實(shí)現(xiàn)的目的;
所以,此時(shí)的問(wèn)題就變成了,如何在保護(hù)輸入數(shù)據(jù)隱私性的前提下,實(shí)現(xiàn)分析計(jì)算? 這種計(jì)算問(wèn)題,我們稱(chēng)之為“安全多方計(jì)算(SecureMulti-party Computation)”問(wèn)題。
因此,可以支持聯(lián)合計(jì)算并保護(hù)參與者隱私的加密工具,就是解決該問(wèn)題的最好手段。
安全多方計(jì)算(Secure Multi-Party Computation)的研究主要是針對(duì)無(wú)可信第三方的情況下,如何安全地計(jì)算一個(gè)約定函數(shù)的問(wèn)題。目前,安全多方計(jì)算是電子選舉、門(mén)限簽名以及電子拍賣(mài)等諸多應(yīng)用得以實(shí)施的密碼學(xué)基礎(chǔ)。
“Private Join and Compute”工具的實(shí)用性分析
谷歌發(fā)布的名為“Private Join and Compute”的開(kāi)源加密工具,可以快速連接不同數(shù)據(jù)集的數(shù)字列信息,并計(jì)算其中數(shù)據(jù)的總和、計(jì)數(shù)或平均值,但計(jì)算結(jié)果只能通過(guò)解密才能查看——這意味著,你也許只能獲得分析結(jié)果,而計(jì)算過(guò)程中的數(shù)據(jù)是無(wú)法獲得的。這樣以來(lái),“Private Join and Compute”加密工具就滿(mǎn)足了,我們以上所說(shuō)的那3個(gè)矛盾了,即
1.所有參與方的隱私都保護(hù)了;
2.第三方也無(wú)法泄漏隱私數(shù)據(jù);
3.在保護(hù)數(shù)據(jù)隱私的前提下,又達(dá)到了“數(shù)據(jù)共享”應(yīng)該實(shí)現(xiàn)的目的;
“Private Join and Compute”開(kāi)源加密工具使用了二十世紀(jì)70年代的“交換加密”(commutative encryption)技術(shù),允許使用多個(gè)密鑰對(duì)數(shù)據(jù)集中的數(shù)據(jù)進(jìn)行加密,而無(wú)需考慮密鑰的使用順序。該技術(shù)有助于多方計(jì)算,用戶(hù)需要應(yīng)用、并剝離多層加密,但卻不會(huì)對(duì)加密數(shù)據(jù)執(zhí)行的計(jì)算產(chǎn)生影響。更重要的是,“Private Join and Compute”開(kāi)源加密工具還結(jié)合了二十世紀(jì)90年代的一些加密方法,這些方法能讓系統(tǒng)組合兩個(gè)加密數(shù)據(jù)集,確定它們的共同點(diǎn),然后通過(guò)稱(chēng)為“同態(tài)加密”(homomorphic encryption)的技術(shù)直接對(duì)這個(gè)加密加密且不可讀的數(shù)據(jù)執(zhí)行數(shù)學(xué)計(jì)算。
谷歌隱私工具和基礎(chǔ)設(shè)施工程總監(jiān)阿曼達(dá)•沃克(Amanda Walker)表示:最終的結(jié)果是,谷歌可以在不暴露任何個(gè)人數(shù)據(jù)的情況下執(zhí)行計(jì)算,然后只獲得匯總結(jié)果。實(shí)現(xiàn)這一目標(biāo)的原生方法是獲取兩個(gè)敏感數(shù)據(jù)集,將他們轉(zhuǎn)儲(chǔ)到一個(gè)數(shù)據(jù)庫(kù)里,再進(jìn)行連接和匯總,不過(guò)如果你將所有內(nèi)容放在一起,那么就可能會(huì)面臨數(shù)據(jù)泄露的風(fēng)險(xiǎn)。
以學(xué)校的食堂為例,“Private Join and Compute”開(kāi)源加密工具能夠允許各方持有非常敏感的數(shù)據(jù),但卻不會(huì)相互泄露敏感信息。這樣學(xué)校為所有學(xué)生供應(yīng)的食物可以在衛(wèi)生保健機(jī)構(gòu)的數(shù)據(jù)沒(méi)有泄漏的情況下,做到有針對(duì)性的調(diào)整。
另外,目前處于測(cè)試中的“Private Join and Compute”還不完美,對(duì)此,阿曼達(dá)•沃克是這樣說(shuō)的:由于正在測(cè)試中,Private Join and Compute目前只能進(jìn)行部分的多方計(jì)算,目前谷歌在考慮是否能夠優(yōu)化這些加密操作,不過(guò)這并不影響實(shí)際的使用。
目前,谷歌已經(jīng)向?qū)W術(shù)界和相關(guān)行業(yè)的人士分享了一篇相關(guān)論文,其中就介紹了“Private Join and Compute”開(kāi)源加密工具運(yùn)行的原理和理論基礎(chǔ)。由于谷歌正在開(kāi)源這款工具,因此未來(lái)我們會(huì)有更多機(jī)會(huì)審查該工具的安全性和隱私性。
泰爾•馬爾金(Tal Malkin)是哥倫比亞大學(xué)密碼學(xué)家,他表示自己很早就看過(guò)了這篇論文,并認(rèn)為這款新工具代表著加密行業(yè)向前邁出了重要一步,因?yàn)樗鼇?lái)自于谷歌,而且還是開(kāi)源的。
泰爾•馬爾金表示:自二十世紀(jì)80年代以來(lái),安全計(jì)算一直是密碼學(xué)重點(diǎn)研究的領(lǐng)域,但直到最近才被業(yè)內(nèi)認(rèn)為是一種專(zhuān)業(yè)的理論研究。我認(rèn)為,谷歌希望開(kāi)放這個(gè)重要的隱私技術(shù),這非常令人興奮。
小編猜想,如果“Private Join and Compute”開(kāi)源加密工具被投入使用,相信它的普及率會(huì)非常快,因?yàn)閷?duì)于許多企業(yè)來(lái)說(shuō),用戶(hù)數(shù)據(jù)無(wú)疑是個(gè)黃金寶藏,想要讓他們“老貓枕著咸魚(yú)睡覺(jué),”,怎么可能,有了“Private Join and Compute”,很多收集用戶(hù)數(shù)據(jù)的企業(yè),就可以在不超越隱私范圍的前提下研究私人數(shù)據(jù)。
例如,谷歌的沃克表示,他們已經(jīng)在美國(guó)推出了一項(xiàng)使用該工具進(jìn)行廣告測(cè)量的beta測(cè)試。美國(guó)民主與技術(shù)中心(Center for Democracy and Technology)的首席技術(shù)專(zhuān)家約瑟夫•洛倫佐•霍爾(Joseph Lorenzo Hall)也表示:Private Join and Compute潛在的應(yīng)用非常令人興奮,谷歌正在使用數(shù)學(xué)方法來(lái)讓兩個(gè)不相互信任的雙方,在非常安全的情況下,完成數(shù)據(jù)的組合,而不會(huì)發(fā)生才泄漏風(fēng)險(xiǎn)。
雖然Private Join and Compute工具可能會(huì)使得數(shù)據(jù)分析更加準(zhǔn)確,但計(jì)算仍然是基于敏感數(shù)據(jù)集進(jìn)行,所以可能不適用于所有數(shù)據(jù)分析的場(chǎng)景。
霍爾也表示:這種分析往往坑你會(huì)得出某些令人意外的分析結(jié)果,或者在某種程度上,Private Join and Compute工具可能會(huì)使信息以另外一種方式進(jìn)行泄漏,造成新的數(shù)據(jù)安全問(wèn)題。
正如密碼學(xué)家Phil Rogaway所說(shuō):保護(hù)數(shù)據(jù)隱私的最好辦法,還是對(duì)數(shù)據(jù)進(jìn)行嚴(yán)密的監(jiān)控和管理。