近年來,科技巨頭們一直在不遺余力地拓展人工智能技術的應用范圍,刷臉支付、無人駕駛、無人酒店、智能上菜、智能機器人、智能醫生…… ,在釋放巨大應用價值和商業價值的同時,人工智能的推廣使用也產生了一些“副作用”。個人隱私信息被非法采集、無人駕駛汽車失控、利用大數據實施精準詐騙等。同時,隨著5G技術的發展,物聯網設備被大規模利用發起網絡攻擊的風險也將更加突出,一旦泄露或遭到非法利用,將會給個人甚至國家帶來無法彌補的損失。
如何保護重要數據不被泄露?如何實現數據安全共享、分析挖掘的同時,保護企業及個人敏感、隱私信息不被泄露?如何將無用和有害的“垃圾”數據進行清洗?保護數據隱私、實現數據價值最大化的關鍵核心在于:數據治理、數據安全和數據生態。
浪潮攜手中國領先的數據技術服務提供商北京海量數據技術股份有限公司(簡稱海量數據),雙方聯合開發數據脫敏解決方案InfoMask,對用戶隱私信息進行嚴格脫敏處理,既最大限度保障用戶信息安全,又能為企業賦能,幫助企業充分釋放數據價值。
InfoMask方案
傳統方式的數據脫敏工作量不可控,每個系統要幾十到幾百人天。而InfoMask解決方案集合了數據抽取、數據合規脫敏、測試數據管理、數據裝載等功能于一體,具有流程化、自動化和作業復用等特點。作為軟硬一體化的設備,擁有強大的功能、易于部署和使用等特點,開箱即用式的優勢能夠極大減輕工作人員的工作強度以及項目周期,完全滿足各行業數據脫敏、快速業務部署需求。
保障用戶隱私數據的泄露風險
在各類政務系統中存在著的大量居民和企業單位信息,包括了姓名、居民身份證號碼、企業單位名稱、組織機構代碼、工商注冊號、納稅人識別號、電子郵箱、聯系地址、電話等等,這些都屬于敏感資料,也就是需要保護的對象。
由于電子政務系統的數據量過于龐大,對數據的脫敏程度越高,對運維人員的依賴就越低,同時數據也更加安全。因此,電子政務系統對數據脫敏提出了更高的要求:首先,是要從數據庫外鍵層、系統層面、全單位層面保證數據的關聯性; 第二,要保證數據不可逆; 第三,要保證數據的高仿真。同時,一個優秀的數據脫敏系統還要做到對隱私數據的精準定位。
為了達到脫敏的要求,根據客戶隱私數據的定義,InfoMask針對數據庫梳理出一套完整的隱私數據的模型和關系。發現功能會從生產數據源進行數據采樣,然后對采樣數據進行掃描,并根據InfoMask內置的眾多隱私數據保護特征算法進行分析,定位哪些表哪些字段為隱私數據,屬于哪種隱私數據。
多維度數據隱私保護及脫敏規則和算法
根據對生產數據的定義,InfoMask會從生產數據庫或真實數據庫快照等數據源當中周期性地抽取真實數據,且數據源種類支持各種主流的數據庫系統。根據定義好的隱私數據模型,InfoMask將已經獲取的真實數據使用特定的漂白規則進行脫敏,生成合規數據。
完善的訪問管理機制
InfoMask平臺擁有完善的訪問管理機制,包括,用戶管理、各功能模塊的使用和數據的訪問權限。系統默認通過角色對用戶的權限進行控制,缺省角色包括了系統管理員、數據管理員、操作員、開發者等。以此即可完成對各種用戶角色的使用和訪問控制。
“幾年前,我們使用過其他數據脫敏產品,但因為產品只具備從頭脫到底的全量脫敏方案,不支持增量處理,如果數據量大時要花費幾天甚至一周的時間才能完成數據脫敏工作,脫敏效率完全滿足不了業務需求。InfoMask能夠很好地實現增量數據的抽取與處理,面對大數據庫時,可以僅針對新增數據而不是全部數據進行脫敏,大大提升了工作效率。同時,InfoMask對數據全生命周期進行防護,在保存業務數據原始特征的同時,保護敏感數據免于未經授權的訪問,同時又可以進行相關的數據處理。“某行信息化負責人如此評價。
InfoMask功能
保證了數據的安全,數據要發展起來也必須要建立一個生態,這里面有數據的親歷者,有數據的加工者,有數據的使用者等等。浪潮在此前就提出過此觀點,即需要通過一個生態的建設,來發揮數據全部的價值。秉承此開放理念,浪潮攜手各個伙伴,聯合打造行業解決方案,助力客戶從數字化向智能化邁進。未來,浪潮攜手海量數據,將圍繞客戶需求,打造更多合作標桿案例,并進一步完善合作伙伴生態圈,共同開拓數據脫敏市場,為信息安全保駕護航。
隨著傳統行業擁抱AI,向智能化轉型,“產業AI化”也勢必將迎來蓬勃發展階段。浪潮全棧式AI計算系統,為用戶提供強自適應、高效加速、靈活拓展的基礎架構系統,前端承接多源數據,后端支撐行業應用,加速賦能行業智慧化轉型,助推行業從“互聯網化”邁向“智能化”。