今年1月,國務院辦公廳印發(fā)《要素市場化配置綜合改革試點總體方案》,推動要素市場化配置改革向縱深發(fā)展?!斗桨浮诽岢隽颂剿鹘?shù)據(jù)要素流通規(guī)則的試點任務,依托多方安全計算、聯(lián)邦學習等隱私計算技術,探索實現(xiàn)“原始數(shù)據(jù)不出域、數(shù)據(jù)可用不可見”的數(shù)據(jù)流通交易新范式,成為數(shù)據(jù)融合創(chuàng)新的新途徑、新方向。
近日,浙江大學計算機科學與技術學院教授鄭小林發(fā)表《隱私計算賦能數(shù)據(jù)價值合規(guī)流通》的主題演講,企業(yè)網(wǎng)D1Net對演講中的核心內(nèi)容進行整理報道。鄭小林提到,隱私計算目前有三種主流技術:包括多方安全計算、聯(lián)邦學習和可信執(zhí)行環(huán)境,三者各有優(yōu)劣,可面向不同需求場景。
鄭小林參與的國家重點研發(fā)計劃“大數(shù)據(jù)征信及智能評估技術”項目,旨在解決中國互聯(lián)網(wǎng)大數(shù)據(jù)征信中跨域數(shù)據(jù)流通面臨的流通機制、跨域數(shù)據(jù)融合與聯(lián)合計算、隱私保護等難題,目前已在“智慧金融、智慧政府、智慧企業(yè)”三大領域落地。
鄭小林 浙江大學計算機科學與技術學院教授 金智塔科技創(chuàng)始人&首席科學家
數(shù)據(jù)應用邁向“隱私計算時代”
今年1月國務院辦公廳印發(fā)《要素市場化配置綜合改革試點總體方案》的通知中,第六條明確提出“探索建立數(shù)據(jù)要素流通的規(guī)則”應從四個方面展開:一是完善公共數(shù)據(jù)開放共享機制;二是建立健全數(shù)據(jù)流通交易規(guī)則;三是拓展規(guī)范化數(shù)據(jù)開發(fā)利用場景;四是加強數(shù)據(jù)安全保護。
其中,在“建立健全數(shù)據(jù)流通交易規(guī)則”中,重點強調(diào)要“探索‘原始數(shù)據(jù)不出域、數(shù)據(jù)可用不可見’的交易范式,在保護個人隱私和確保數(shù)據(jù)安全的前提下,分級分類、分步有序推動部分領域數(shù)據(jù)流通應用。”
鄭小林提到,在《數(shù)據(jù)安全法》、《個人信息保護法》的支撐下,整個數(shù)據(jù)應用開始步入3.0模式,即從“明文數(shù)據(jù)的API接口時代”邁向“隱私計算時代”。
隱私計算技術的發(fā)展史
實際上,隱私計算的基礎技術已經(jīng)發(fā)展了幾十年:
1976年提出Diffie-Hellman密鑰交換算法;
1979年提出秘密分享;
1982年姚期智院士提出多方安全計算;
1985年提出乘法同態(tài);
1999年提出加法同態(tài);
2009年提出全同態(tài)FHE;
2006年提出差分隱私;
2010年提出TEE可信執(zhí)行環(huán)境;
2016年谷歌提出聯(lián)邦學習;
2018年,我國進入隱私計算時代。
隱私計算技術的三大技術流派
鄭小林提到:目前,隱私計算以三大技術流派為主,分別是可信執(zhí)行環(huán)境,聯(lián)邦學習和多方安全計算,經(jīng)過多年的發(fā)展,三大技術的內(nèi)涵已發(fā)生重大的變革和提升。其中,可信執(zhí)行環(huán)境(TEE)是完全集中式計算,聯(lián)邦學習是部分集中式計算,多方安全計算(MPC)是完全分布式計算。
可信執(zhí)行環(huán)境(TEE)是2010年Global Platform提出的,通過創(chuàng)建一個可以在TrustZone中獨立運行的小型操作系統(tǒng)實現(xiàn)高安全需求的操作,保護“指紋、密碼、私鑰”等敏感數(shù)據(jù)和高價值數(shù)據(jù)。TEE屬于To C的解決方案,且需要芯片支持,而我國受制于芯片和根證書的限制,TEE方案在商業(yè)場景中的推廣很少。
聯(lián)邦學習是2016年由谷歌提出的,用于解決機器學習中的隱私問題,保護C端用戶的隱私,而我國將聯(lián)邦學習技術應用于To B場景,用于已經(jīng)收集好的用戶數(shù)據(jù)的隱私保護,解決多方聯(lián)合建模中的隱私問題,實現(xiàn)“數(shù)據(jù)不動模型動”的國產(chǎn)化To B聯(lián)邦學習解決方案。聯(lián)邦學習的安全性是一大研究熱點,安全聯(lián)邦學習有兩種解決方案:一種是使用差分隱私提升安全性,另一種是使用MPC(例如秘密分享)來提升安全性。
多方安全計算(MPC)的計算模式不存在一個中立可信的第三方,通常一個計算方需要跟其他所有參與方通信來協(xié)同計算。MPC以密碼學為基石,除輸入和輸出外,不泄露任何中間信息,可以實現(xiàn)整個計算過程的可證安全。
MPC的技術分類包括秘密分享、混淆電路、同態(tài)加密和零知識證明等,其研究熱點除了安全性外,還包括效率和應用性。鄭小林強調(diào),針對特定場景的MPC優(yōu)化很重要,同態(tài)加密是計算密集型,秘密分享是通信密集型,二者結合可以用計算換取通信,適用于參與方計算資源豐富但網(wǎng)絡通信受限的場景,更適合實際的To B業(yè)務。
隱私計算的三種技術路線對比
總體來看,基于密碼學的多方安全計算(MPC)具有可證安全、數(shù)據(jù)不出域兩大優(yōu)勢,具有高安全性,但是非線性計算效率低,參與方數(shù)量有限,適用于安全要求比較高且計算網(wǎng)絡狀況比較好的場景。
聯(lián)邦學習依靠機器學習建模,效率高,具有數(shù)據(jù)不出域、技術門檻較低的優(yōu)勢,但是存在信息泄露的風險,適合數(shù)據(jù)量大、不要求可證安全的加密出域場景,雖然存在梯度泄露問題,但是可以結合差分隱私或者多方安全計算來提升安全性。
可信執(zhí)行環(huán)境(TEE)屬于數(shù)據(jù)加密后的集中計算,具有高安全性、高精度等特點,但需要數(shù)據(jù)加密集中到第三方環(huán)境,限制了其使用場景。
大數(shù)據(jù)征信及智能評估技術與落地成果
鄭小林在2019年參與了國家重點研發(fā)計劃“大數(shù)據(jù)征信及智能評估技術”項目,該項目旨在解決中國互聯(lián)網(wǎng)大數(shù)據(jù)征信中跨域數(shù)據(jù)流通面臨的流通機制、跨域數(shù)據(jù)融合與聯(lián)合計算、隱私保護等難題。該項目由北京郵電大學牽頭,浙江大學、清華大學、北京大學、中科院、國家計算機網(wǎng)絡與信息安全管理中心、中國電信、杭州金智塔科技等20多個單位參與,鄭小林負責多源多模態(tài)海量實時征信大數(shù)據(jù)模型與多維度表示方法這一課題的研究工作。
經(jīng)過兩年多的研發(fā),該項目的落地成果初現(xiàn),金智塔隱私計算平臺實現(xiàn)了聯(lián)邦學習與多方安全計算在一個架構中的融合。隱私計算平臺為數(shù)據(jù)合作方提供了一個工具層,包括數(shù)據(jù)分級分類、數(shù)據(jù)質量審計、數(shù)據(jù)效果分析、資源使用管理、數(shù)據(jù)確權、數(shù)據(jù)應用存證等工具;接入的數(shù)據(jù)涉及知識產(chǎn)權數(shù)據(jù)、征信數(shù)據(jù)、發(fā)票數(shù)據(jù)、政務數(shù)據(jù)、房產(chǎn)數(shù)據(jù)、運營商數(shù)據(jù)、企業(yè)數(shù)據(jù)以及電商數(shù)據(jù)等等。
其中,隱私計算平臺的應用涉及兩個層面,一層是區(qū)塊鏈存證,另一層是針對數(shù)據(jù)進行不同的分級分類,采用用戶授權調(diào)用、加密傳輸、聯(lián)邦學習、多方安全計算等不同的數(shù)據(jù)應用模式。鄭小林透露,該平臺已獲得信通院基礎能力專項評測,在信創(chuàng)領域與華為鯤鵬進行兼容性認證,并先后獲得李德義院士和潘云鶴院士兩大專家組的鑒定,均獲得較高評價。
隱私計算平臺的應用場景與實踐
近兩年,該項目已在智慧金融、智慧政府、智慧企業(yè)、智慧醫(yī)療等多類場景中進行實踐應用,歸納出“單節(jié)點”隱私計算和“多節(jié)點”隱私計算兩種應用模式,單節(jié)點適用于查詢統(tǒng)計等場景,多節(jié)點適用于聯(lián)合建模等場景。據(jù)悉,該隱私計算平臺已向合作方開放,支持需求方進行系統(tǒng)集成,打造聯(lián)合運營平臺。最后,鄭小林介紹了隱私計算平臺的三個主要應用場景。
一是小微科創(chuàng)企業(yè)授信場景。在這一場景中,前期在政務數(shù)據(jù)和商業(yè)數(shù)據(jù)中分別部署隱私計算節(jié)點,同時在銀行等金融機構內(nèi)部部署計算節(jié)點和調(diào)度節(jié)點,隱私計算平臺基于這些多方數(shù)據(jù),通過多方安全計算和隱私求交找到共有企業(yè),為小微科創(chuàng)企業(yè)構建準入模型、成長模型、風險評估模型和額度模型等等。企業(yè)用戶基于這些模型拿到授權后,即可到調(diào)度節(jié)點調(diào)度政務數(shù)據(jù)和商業(yè)合作方的數(shù)據(jù),進行計算后可以得到相應的準入、成長率、風險以及額度情況的授信報告,進行貸款審批。
以科創(chuàng)貸款為例,企業(yè)用戶在隱私計算平臺上經(jīng)過主體授權后,進行企業(yè)類別的智能分類,然后進入準入模型,通過生命周期模型、成長力模型、知識產(chǎn)權定價模型和授信模型的逐步計算,實現(xiàn)授信額度的在線獲取和一鍵申請。該方案已推廣到10余家農(nóng)商行、城商行和股份制銀行,取得了良好的社會效益和經(jīng)濟效益。
二是智能營銷場景。通過在高德數(shù)據(jù)、房產(chǎn)數(shù)據(jù)、運營商數(shù)據(jù)和電商數(shù)據(jù)等進行計算節(jié)點部署,隱私計算平臺成功為某上市奢侈品企業(yè)構建智能選址系統(tǒng),針對商圈業(yè)態(tài)的豐富度、交通便利性、商業(yè)面積、競品數(shù)量、客流指數(shù)、服務人口數(shù)量等,以隱私計算的方式實現(xiàn)聯(lián)合建模,形成價值提升模型、潛客挖掘模型、交叉營銷模型和智能選址模型等,助力企業(yè)進行線上和線下運營。
三是多方聯(lián)合統(tǒng)計場景。隱私計算平臺在某省統(tǒng)計局部署中心節(jié)點,在征信公司、電力公司、市場監(jiān)管局、經(jīng)信廳等政務部門內(nèi)部的數(shù)據(jù)共享、數(shù)據(jù)交換、數(shù)據(jù)校驗等方面提供隱私保護技術支持,分別實現(xiàn)數(shù)據(jù)隱私的聯(lián)合校對、雙碳數(shù)據(jù)的隱私計算、共富指數(shù)的聯(lián)合預警,畝均論英雄的聯(lián)合隱私統(tǒng)計等等。