使用數據、高級分析或AI的公司需要數據治理計劃。顧問兼作家Robert Seiner表示,最好的方法是非侵入性數據治理。
Seiner花了20年的時間研究數據治理。作為Kik Consulting的總裁和負責人,他與公司合作解決他們的治理問題,并實施他的非侵入性數據治理框架。
2014年,Seiner出版了他的第一本書《非侵入性數據治理:最小阻力和最大成功之路》,并為公司介紹了一種考慮構建數據治理結構的新方法。非侵入性數據治理側重于將現有角色可能已經具有的責任正式化,而不是重組職責并潛在地增加員工工作負荷的責任。
自從出版了他的第一本書并幫助世界各地的公司實施他的框架以來,他在公司面臨的數據治理問題上學到了新的教訓和觀點,他于2023年出版了第二本書——非侵入性數據治理再次出擊:獲得經驗和觀點——分享了這些見解和非侵入性數據治理成功所需的框架。
Seiner接受了記者的采訪,談到了非侵入性數據治理與其他數據治理方法的區別,為什么他的框架是數據和分析操作成功的關鍵,以及GenAI對數據治理的影響。
非侵入性數據治理與其他數據治理方法有何不同?
Robert Seiner:公司可以采用三種方法進行數據治理。有一種命令和控制,自上而下的方法,每個人都被分配了新的角色,對公司來說感覺是全新的。有一種傳統的方法遵循電影《夢想之地》的理念——“如果你建立它,他們就會來”——公司構建了一種數據治理方法,并希望人們會被它所吸引,然后還有第三種方法,我的非侵入性方法,這種方法假設公司中已經有了責任級別,并且它專注于將責任正式化,而不是將其作為對他們來說是全新的東西交給他們,它的威脅要小得多,這種方法不是給人們分配新的東西,而是根據他們與數據的關系來識別他們,并幫助他們更有效地管理,而不是故意增加他們已經在做的事情。
非侵入性數據治理是公司現在使用的主要方法,還是他們正在更多地使用其他方法?
Seiner:我想說的是,大多數公司仍然遵循傳統的方法,他們建立了一個程序,并希望人們會被吸引過來。有很多公司告訴我,唯一對他們有效的方法是保持非侵入性。人們通常在100%以上的時間里已經很忙,如果他們覺得你增加了他們的工作努力,他們就會推后。有很多公司來找我說,我們需要有一個數據治理計劃,非侵入性是我們需要遵循的方法。隨著人們對它的不斷了解,人們對它的興趣似乎越來越大。
公司在嘗試采用非侵入性數據治理時遇到的最大挑戰是什么?
Seiner:最大的挑戰是向它應用必要的資源。我已經和幾個公司談過,他們認為通過創建一個數據治理程序,它將自動運行。需要有與實施數據治理和元數據管理相關的資源。如果沒有元數據文檔,很難管理你的數據。
比其他公司做得更好的公司是那些將資源應用于其努力的公司,仍然有很多公司很難找到資源來應用于數據治理,這是令人驚訝的,因為公司應該預料到該程序不會自動運行。最大的障礙,因此也是最大的挑戰,是在公司的最高層,他們往往仍然不認識到他們為什么需要這樣做。
我總是用‘數據不會自我支配’這句話,治理需要了解數據的人來治理它,元數據將不會自行管理,該程序不會自動運行,數據治理是對數據和數據管理資產的授權的執行和強制執行,你采用什么方法進行數據治理并不重要。歸根結底,你需要執行和加強權威,否則人們不會遵循標準、政策和規則,問題是你想用什么方法。
實現你在第1章中繪制的非侵入性數據治理框架有多難?
Seiner:有了我在書中分享的框架,你不應該試圖一次實現所有的框架。我建議公司找到框架中[他們]需要關注的部分,該框架旨在使核心組成部分與本公司的觀點相匹配,例如,有必要描述行政人員的角色、戰術人員和操作人員的角色,而且,有必要記錄能夠安撫公司的戰略和支持級別的指標。公司需要在某個時候了解框架中收集的所有信息。如果你采用結構化的方法來使用該框架,那么實現該框架并不困難。如果你試圖一下子接受這一切,特別是如果你沒有一個好的計劃來做到這一點,那就會變得更加困難。
在討論數據和分析話題時,很難不提到GenAI。GenAI和大型語言模型對未來的數據治理責任有多大影響?
Seiner:是的,AI將強調治理的重要性,就像它之前出現的任何其他東西一樣,可以應用于數據倉庫和分析平臺的相同級別的治理必須應用于AI和大型語言模型。因此,你必須對數據進行控制,這是與之相關的挑戰。你不能讓任何人問高管的工資是多少,然后得到答案,例如,需要對人們可以看到和使用的內容進行限制。
還需要理解我們如何有效地使用AI。GenAI于2022年11月成為主流,它仍然是一門不斷發展的學科和科學,而且它只會成為一個越來越有價值的工具,我們需要在數據周圍放置控件,明白必須治理其數據的公司將比那些現在才開始的公司更有優勢。
如果你現在沒有采用GenAI或LLM,這并不意味著數據治理對你來說就不那么重要了?
Seiner:這絕對不意味著你對數據治理的需求減少。大多數公司正處于開始考慮大型語言模型和部署產生式AI的階段,但大多數大型公司還沒有開始走這條路。任何公司如果想要確保他們的數據受到保護、共享,并遵循監管方面的擔憂,確保數據不會重復,有高質量的數據,就需要數據治理。AI只是另一個應用程序。它可能感覺更多,但它實際上是對數據進行保護和控制的另一種應用。隨著人們對AI的依賴程度越來越高,AI背后的數據將決定他們對AI的使用。
如果它提高了人們對數據治理的認識,那就是一件好事。如果它提高了人們對非侵入性數據治理的認識,那就更好了。
你還有什么最后要說的嗎?
Seiner:第二本書的名字是《非侵入性數據治理再次出擊》,這不是第一本書的第二版,它包含50篇文章,重點是我在世界各地的公司中使用這種方法所學到的教訓和獲得的觀點。這本書很容易讀,你可能不想把它直接讀完,你可能會發現一個你感興趣的話題,然后直接去做。這是在非侵入性數據治理方面學到的真正經驗教訓。這本書的標題暗示了這樣一個事實,即非侵入性數據治理已經開始——以第一本書的形式出現。非侵入性和突破性的東西處于光譜的兩端。
企業網D1net(hfnxjk.com):
國內主流的to B IT門戶,同時在運營國內最大的甲方CIO專家庫和智力輸出及社交平臺-信眾智(www.cioall.com)。同時運營19個IT行業公眾號(微信搜索D1net即可關注)。
版權聲明:本文為企業網D1Net編譯,轉載需在文章開頭注明出處為:企業網D1Net,如果不注明出處,企業網D1Net將保留追究其法律責任的權利。