不斷過濾清理數據,直到確保它的正確性的日子已經逐漸成為奢望,尤其是當IT部門需要以更快的速度和更多的靈活性來響應業務部門的需求時。但是,提供實時數據的使用也讓CIO們產生了一個基本問題:數據究竟如何才算正確呢?Farzad Mostashari,美國衛生和公眾服務部的, 前衛生信息技術的國家協調員,就曾經論證了解決錯誤數據的方法就是更多的錯誤數據。在去年夏天舉行的一個信息質量會議上,他曾經說過,不斷增加的數據“為你提供了上下文,”。其他專家,比如Michael Berry,TripAdvisor網站的業務運營分析總監,則認為并非如此。他在去年秋天的預測分析大會上說,他認為并不需要擔心數據的正確性,因為他們有太多的數據“肯定就是錯誤的,”。
Greg Pfluger,American Family Insurance公司的信息系統副總裁,則有不同的觀點。在本期專家訪談中,Pfluger在麥迪遜,威斯康星州舉行的 Fusion 2014 CEO-CIO Symposium研討會上,向CIO們和IT主管們就此進行演講,并回答相關問題:更多的數據還是正確的數據?
Greg Pfluger:這有可能是未來五年內,IT界將不得不面對的關鍵問題之一。 我們擁有大量的不斷涌現的外部數據來源,因為各種業務需求我們需要整合這些數據 但有時我們并不清楚這些數據僅是作為數據的一部分,還是這些數據要求高度正確性。我并不認為通過這次的討論,我們可以從行業標準,得出兩個或三個類別的硬性指標,并都以此作為參考。隨著時間的推移,這些類別在不同的業務部門和行業都會不同。我鼓勵IT主管們,自己思考在他們所處的特定分析環境下,應該如何對這些數據進行分類。
例如, CIO可以把數據分成三個類別:類別一,我們并不在意數據的正確性;我們只是試圖讓我們的市場營銷工作做的更好。如果我們的營銷數據從2 %上升到3 % ,我們就是成功的。雖然我們處理的有些數據有些可疑,但是這不要緊。
相比營銷數據,第二個類別,用來針對現有客戶的數據,質量則要更高一些。我敢肯定,我們都會時不時地因為我們的有線電視運營商的服務和定價而感到惱怒。 我每個月至少有一次都會因為我的供應商而惱火,因為不知出于什么原因,他們的老客戶數據庫和當前的客戶數據庫并不匹配。當我從Stevens Point,威斯康星州搬走時,我取消了我的服務,我現在住在麥迪遜,從同一個供應商訂購了新的服務。但現在,他們不斷地嘗試想讓我重新成為他們的客戶 - 即使我現在已經是他們的客戶。 他們向我作為賬單地址的電子郵件賬戶發送營銷郵件。如此看來,我不能退訂這些郵件,因為這樣我就會收不到我的賬單。他們在一定程度上肯定進行了數據整合,但是肯定沒有完全整合正確,因為他們不把我認為是他們的現有客戶。
第三個類別,當你試圖處理用戶事務時,你需要非常高質量的數據。 我最近聽到了一個同事的經歷,由于冬季風暴造成了他的航班延誤。在這期間,Delta航空不斷向他發送最新的信息,并且自動為他重新預訂了航班,因此在這之后,他成為了Delta的忠實客戶。現在,他甚至愿意為乘坐Delta的航班而支付額外的費用 哪怕航班取消!
新一代的航空公司服務,我敢肯定,將會更加積極主動。他們會知道一場風暴即將到來,然后向乘客提供提前一天的航班,而不加收費用,這樣既幫助你到達目的地,也有助于減少他們系統中的混亂。你可能會很高興收到這樣的電子郵件,為你提供較早的航班離開,也許你甚至愿意為此而多花些費用。但如果風暴的數據錯誤,或你的地址是錯誤的,或你的起飛機場是錯誤的,當你收到這個電子郵件時會發生什么?你會說,"不對,沒有風暴的預報呀, 這一航空公司就會失去信譽 這一切需要很高的精確度。
IT部門需要思考適合他們自己企業的分類類別,并對每個類別提供適當的數據治理方案和數據質量處理流程。