作者為 亞信科技(中國)有限公司網絡安全事業部 尹雯玉
數據脫敏(Data Masking),又稱數據漂白、數據去隱私化或數據變形。百度百科對數據脫敏的定義為:指對某些敏感信息通過脫敏規則進行數據的變形,實現敏感隱私數據的可靠保護。這樣,就可以在開發、測試和其它非生產環境以及外包環境中安全地使用脫敏后的真實數據集。
可以看到數據脫敏具有幾個關鍵點:敏感數據、脫敏規則、使用環境。
敏感數據,又稱隱私數據,常見的敏感數據有: 姓名、身份證號碼、地址、電話號碼、銀行賬號、郵箱地址、所屬城市、郵編、密碼類 ( 如賬戶查詢密碼、取款密碼、登錄密碼等 )、組織機構名稱、營業執照號碼、銀行帳號、交易日期、交易金額等。
隨著大數據時代的到來,大數據商業價值的挖掘,用戶的精準定位,大數據中蘊藏的巨大商業價值被逐步挖掘出來,但是同時也帶來了巨大的挑戰--個人隱私信息的保護。個人信息與個人行為(比如位置信息、消費行為、網絡訪問行為)等,這些都是人的隱私,也是我們所關注的一類敏感信息,在大數據價值挖掘的基礎上如何保護人的隱私信息,也將是數據脫敏必須解決的難題。
脫敏規則,一般的脫敏規則分類為可恢復與不可恢復兩類。
可恢復類,指脫敏后的數據可以通過一定的方式,可以恢復成原來的敏感數據,此類脫敏規則主要指各類加解密算法規則。
不可恢復類,指脫敏后的數據被脫敏的部分使用任何方式都不能恢復出。一般可分為替換算法和生成算法兩大類。替換算法即將需要脫敏的部分使用定義好的字符或字符串替換,生成類算法則更復雜一些,要求脫敏后的數據符合邏輯規則,即是“看起來很真實的假數據”。
使用環境,主要指脫敏之后的數據在哪些環境中使用。普遍按照生產環境和非生產環境(開發、測試、外包、數據分析等)進行劃分。
在最近一期的Gartner關于數據脫敏的報告(Magic Quadrant for Data Masking Technology-2014年12月)中根據數據脫敏產品應用場景的將數據脫敏劃分為靜態數據脫敏(static data masking[SDM])和動態數據脫敏(dynamic data masking[DDM])。
靜態數據脫敏(SDM)與動態數據脫敏(DDM)主要的區別是:是否在使用敏感數據當時進行脫敏。
靜態數據脫敏(SDM)一般用在非生產環境,在敏感數據從生產環境脫敏完畢之后再在非生產環境使用,一般用于解決測試、開發庫需要生產庫的數據量與數據間的關聯,以排查問題或進行數據分析等,但又不能將敏感數據存儲于非生產環境的問題。
動態數據脫敏(DDM)一般用在生產環境,在訪問敏感數據當時進行脫敏,一般用來解決在生產環境需要根據不同情況對同一敏感數據讀取時需要進行不同級別脫敏的問題。
在上文中提到的Gartner是全球最具權威的IT市場與顧問咨詢公司,就IT的研究、發展、評估、應用、市場等領域,為客戶提供客觀、公正的論證報告及市場調研報告,協助客戶進行市場分析、技術選擇、項目論證、投資決策。Gartner每年都在關鍵領域,采用“魔力象限圖”對主要廠商進行定位,是在某一特定時間內的對市場情況進行的圖形化描述。魔力象限的四個象限依次分別為領導者(Leaders)、挑戰者(Challengers)、有遠見者(Visionaries)和特定領域者(Niche Players)。
數據脫敏首次作為一個單獨的魔力象限被Gartner發布是在2012年12月,每年的12月Gartner會發布當年數據脫敏方面的分析報告,迄今為止一共發布了3期。
我們在這三份報告的基礎上分析近年來數據脫敏方面的變化,并對未來的發展進行展望。
1、數據脫敏市場定義與描述比較(Market Definition/Description)
可以看出,關于在最近一期的報告中,并沒有把“結構化/非結構化”(即是否是關系型數據類型)單獨作為一個分類的標準,而是將“實時/非實時”以及“生產/非生產”作為了關鍵指標。沒有強調非結構化數據(Data redaction masks)作為一個單獨分類。
2、評價標準比較
Gartner對數據脫敏產品的評價,主要分為執行能力和完整的愿景兩方面,具體的方面見下圖:
比較近三年的報告,上圖中紅色部分的評價標準發生了變化,具體內容如下:
可以看到,在13年評價標準發生了一個較大的變化,就是從原來的關注SDM轉變為SDM與DDM均有,并且開始關注大數據與云數據安全。在13年產品與服務類別,評價中考慮是否提供了其他的安全產品相配合;而到14年數據智能被提到更重要的位置上作為產品與服務的評價項目。
3、象限位置定義
對于象限的定義上,13年與14年沒有什么差別,而12年的差別也是在于12年從SDM上考慮的多,而DDM幾乎沒有被考慮,這里不再進行比較。在分析了14年的報告以后,得出的象限標準如下圖:
在過去的幾年,層出不窮的隱私數據泄密事件已經證明,企業和政府機構的數據安全,內部人的泄密比外部黑客攻擊后果更嚴重。
近年來數據脫敏歷經了一個從重視靜態數據脫敏(SDM)到靜態數據脫敏(SDM)、動態數據脫敏(DDM)同樣重視的程度,即覆蓋面正在從非生產系統到生產系統。
隨著大數據、云平臺的發展,大數據平臺與云平臺上數據隱私保護的研究與產品也將長足發展,同時敏感數據的智能探測、智能分析與統計、智能處理也將會被作為一個重要的產品發展方向。
亞信NSG緊跟時代的步伐,正致力于各類數據的脫敏,目標成為數據脫敏產品行業的專家。關于Oracle數據庫的動態數據脫敏(DDM)產品已落地,可以幫助客戶有效的保護生產環境中傳統數據庫的敏感數據;并且正在積極開展靜態數據脫敏(SDM)的研究與落地;同時,我們緊跟時代步伐,致力于研究將DDM、SDM產品應用于大數據、云平臺方面,為數據保駕護航!