數據隱私與訪問的討論在物聯網時代變得越來越復雜
在之前一些文章中,我已經警告過一些組織機構機構可能很快就會遭遇數據問題——被鎖定、趕出或以其他方式禁止訪問,以有助于優化未來業務的關鍵新數據源的可能性。
雖然我相信每個數據驅動的組織機構現在就應該開始規劃,以避免最終導致數據不足的問題,但這一擔憂只是新的大數據、物聯網(IoT)世界中出現的很多潛在的數據問題之一。事實上,獲得正確數據的問題將變得更為重要,因為我預測今后將出現一個新的戰略數據支持規則和流程,不僅僅是管理和保護有價值數據,而且還要確保擁有公司可能需要的所有必要和有效數據,以保持競爭力。
除了避免數據不足之外,數據支持意味著IT還需要考慮如何管理和解決數據隱私與真實性中的關鍵問題。在這個時代分析中正確使用數據的深入討論尚在填補空白,且仍然未確定,但IT需要為未來幾年出現的任何數據政策作好準備。
真偽還是隱私?許多人深入探索數據隱私,對于如何最好地平衡數據共享的個人、組織機構或社會效益或者在公共數據和私人數據之間畫上紅線,我沒有任何直接的建議。但是,如果我們從大多數組織機構的角度來看待隱私,那么第一個要求就是要達到規定個人資料控制的法規和合規。這將包括病歷、工資和其他人力資源數據。然而,許多商業組織機構保留訪問、管理、使用和分享系統中任何東西的權利,還包括由員工存儲或創建的任何數據,除非其得到特別保護。
如果從事運輸業務,使用來自包裹和卡車上的GPS和其他傳感器數據。這看似公平,畢竟卡車司機知道他們的雇主正在監控他們的進展和駕駛習慣。但是當組織機構追蹤與IoT設備的互動時會發生什么?
許多人正在努力使GPS在室內進行工作,表面上作為使用WiFi設備和其他設備的公共服務來幫助三角測量手持設備的位置,而實際上為的是實時定位人群,并繪制詳細藍圖。
在購物中心,這個跟蹤細節從使購物者進入的商店時開始,針對性地展示的廣告和優惠以促進交易。業務環境中的這些數據可能會告訴雇主誰在旁邊,以及使用者在線查看的時間、收到的電話等等。我們的私人時間是不是也在監控中呢?更不用說這種方式來監控閑暇時間——浴室休息和自動售貨機前的選擇……但是,如果存在安全風險,這些數據就可能會被取出來分析,或者如果你買了個糖果棒,可以根據數據進行健康指導調整,而一旦有數據存在,就意味著數據可能會泄漏或被盜。
誠然,通過聚合和匿名識別這些數據中的信息,有辦法確保一些基本的隱私。但是,我們已經知道真正匿名的大數據是非常困難的。累積的物聯網數據可以容易地包含可以與公共數據集相關聯的深入嵌入的線索,以此恢復識別信息。
想像你的汽車報告大部分夜晚停在哪里。或者汽車中的智能部件可以在最后一次維修或升級時跟蹤。制造離合器的業務可以了解汽車所有者的家庭住址,從而了解他們的身份,以及其旅行模式和駕駛習慣。
數據定義你問題不在于您的恒溫器被黑客入侵,或者烤面包機通過家庭防火墻幫助了攻擊者們。更深層次的問題是由機器學習算法進行分析,遠遠超出了您購買的最近供應商和品牌。想象一下,由于您的電動牙刷最近沒有安裝新刷頭,因此必須支付20%-50%保險費。您可能會因為如何加熱或冷卻房子而被標記某些政治概況。您可能被設定為高風險貸款,因為每周選擇多少次與烤面包和百吉餅有一定關聯。 今天,一些供應鏈已經推動嵌入式監控和主動維護,甚至關聯組件來支撐其分析鏈。
沃爾瑪,為供應商提供了一些銷售上的透明度,以換取供應商在店內維護自己的庫存。這似乎很好,因為我們買了傳統商品,一旦我們把它們帶回家,就沒有對我們進行跟蹤。但現在,新智能設備可以保持連續連接并將數據上傳到第三方服務上。誰知道不知不覺中產生了多少和我們有關的大數據?
元數據管理
異常強大的大數據存儲和分析功能,來自物聯網的低級別數據實時流量,越來越多的AI和深度學習,持久性存儲器和升級的芯片嵌入式功能(比如加密)已經擺在面前。由于IT團隊的任務是對任何新功能進行操作,因此他們應該記住,建立可支持細粒度數據管理的、面向未來的可擴展架構至關重要。
我希望組織機構能發現他們需要創建、存儲和使用比今天更多的元數據。此元數據可能包括有關數據使用和訪問時間、監管鏈和出處鏈接的信息、加密標簽、來源可信度、關于可用性的評估,當然也包括通常保留項,敏感性、可訪問性與其他監管問題的策略標簽。而且,元數據本身就是數據,并且具有自己的訪問、隱私和真實性要求,這些需求將遞歸地傳遞給元數據。現在令人頭疼的時期即將發生。
此外,我敢打賭,未來的數據管理產品將會采用微服務,在更接近數據存儲的地方實現數據管理和元數據增強功能。在具有設備級持久存儲器和無定形混合云的大型分布式IoT數據世界中,重要數據可能存在于任何地方,并以敏捷而流暢的方式流動。事實上,有些人預測重要數據不僅將只在流中生成,而且只能通過處理和持久性以流形式存在。
如何在任何時候都能運行,如何管理和保證數據的完整性?那么一來,任何元數據(特別是關于隱私、訪問和真實性)將不得不隨著數據傳播。一個有趣的新興技術是區塊鏈,它已被用作一些新應用程序中的元數據,通過數字簽名幫助確保應用程序數據的來源。 元數據管理功能還需要靠近數據,無論它在哪里,無論去哪里。今天,我們發現新出現的存儲產品支持嵌入式“lambda功能”,其中實際存儲層(如具有事件觸發存儲過程的數據庫)現在可以直接在存儲層中執行任意(包括用戶定義)函數到存儲的數據(和元數據)。
可能需要一段時間才能打造一個積極的、由智能、數據和元數據感知存儲的新世界。可能還需要更多的新功能來幫助解決這些問題。例如,由于所有數據都與所有其他數據相關,在某種程度上,最佳的未來管理視圖可能是通過圖形化元數據庫。然而,IT仍然具有相關性,我們必須準備好應對這些新的挑戰,使數據中心現代化。