據EMC公司自己的首席數據治理官Barbara Latulippe稱,今天的首席數據官(CDO)想要成功的話就需要得到高級管理層的認可和接受。今年在美國麻省理工學院舉行的首席數據官CDO論壇上,Latulippe分享了促進數據所有權和數據訪問的最佳實踐,以及EMC在數據湖方面嘗試的方法。
治理當前的數據湖
治理是Latulippe第一個詳細談到的問題,她把自己團隊在數據管理方面的逐步成熟歸功于EMC公司的歷史。給標記和編目數據湖中的數據創建一個框架,這是數據治理的第一步。
所幸的是,Latulippe的團隊"非常熱衷于元數據",并將他們的熱情傳遞給了使用EMC工具管理數據湖的EMC客戶。Latulippe解釋說,EMC根據企業使用數據湖中數據的方式,有效地交叉分類了信息,并遵循他們的正式流程以便進行恰當的編目。他還指出,技術IT團隊在發揮配置經驗方面扮演重要角色,而且也為數據治理和數據所有權做出了貢獻。
誰擁有數據?
事實上,數據所有權是Latulippe談話中另外一個重要的主題,因為這涉及到對管理和使用數據湖的那些人的問責。當被問及誰擁有數據的問題時,Latulippe回答說,應該是企業擁有數據。
"除了治理,我會說我們還專注于數據質量和數據所有權,我們正在實現數據管理員的移動性……轉向信息價值,甚至是重新塑造首席信息官。我們有數據治理官,但實際的操作仍然是在企業中。我們讓合適的人來幫助業務。"
數據價值幾何?
從數據治理到所有權,數據湖最終必須是一個有價值的商業投資。這是Latulippe的團隊涉足的另一個領域,她負責數據的編目和可移動性。在這個方面,她的團隊正在考慮開發衡量數據價值以及數據對企業影響力的算法。
"哪些數據集是最常用的?我們可以嘗試治理這些數據,確保這些數據的可用性,"Latulippe解釋說。"我們正從這兩方面解決問題--算法,以及考慮企業要治理什么。我們希望專注于關鍵的數據元素,我們認為這是具有高交織的數據集。"
但企業可以把這種價值放到銀行里的嗎?Latulippe當然希望如此--除了企業大數據目標相關的價值之外,她的團隊還希望能展現從金錢角度數據湖所能體現的價值。
"我們正式試圖推動實際的美元計價,"他說。關于治理數據湖,她的團隊要問,"你的數據具有金錢價值嗎,它如何與業務戰略關聯起來?"
安全性與可訪問性的平衡
適當治理數據,從中獲得價值,這還要面對一項挑戰:那就是在確保安全控制的同時,針對企業內需要能連接到有用數據的那些人的可訪問性。Latulippe認為,對于那些管理數據、特別是管理數據湖中的數據的任何企業機構來說,都要面對這個挑戰。
"我們有很多大數據進來,"她提到了蓬勃發展的物聯網市場和Twitter都是目前客戶關心的兩個主要數據源。"從客戶的經驗來說,我們希望知道他們的感受是怎樣的,"Latulippe補充說,會重新考慮用標記和編目數據的方法,在安全性和可訪問性之間找到一種平衡。"治理很好地融合了法律和安全,我們可以針對業務流程對這些數據進行標記。"
另外一個平衡安全性和可訪問性、同時與管理數據湖所有其他目標保持一致的方法,就是給數據集分配一個受托人。這對于那些猶豫著要不要分享數據的企業來說特別有用。"這就是為什么我們想到了受托人的想法,劃分好誰可以訪問,誰正在利用這些數據推動數據所有權,"Latulippe解釋說。