企業在整個組織中部署信息管理最佳實踐的業務驅動力主要有二。首先是為了滿足普遍存在于多個不同行業中的共同需求,例如切實了解客戶和產品以便增加收入并鞏固客戶關系。第二是為了滿足行業特定的運營和分析需求。
這兩個業務驅動力都要求企業更敏捷、更成熟地將精準定義的信息管理實踐與構成端到端信息管理框架的技術相結合。
數據集成
數據集成現已成為企業的命脈。企業日益認識到跨業務部門實現數據共享是何等重要,為滿足這一需求,他們必須提高數據集成的可靠性、性能和數據集成訪問速度,尤其是在以下基礎領域:
• 數據可訪問性 – – 企業必須支持龐大的傳統數據系統環境,尤其是當他們希望掃描歷史數據資產以獲得潛在的商業價值時。數據集成的一個關鍵點便是數據可訪問性,先進的信息管理框架必須能夠提供通往此類廣泛數據源的連接器,包括基于文件的樹形結構數據集、關系數據庫甚至流數據源。
• 數據轉換、交換和交付 – – 一旦數據集允許源頭訪問,數據集成框架就必須能在源和目的地之間有效地轉移數據,必須能將數據從其原始格式轉換為適宜的目標格式,同時能夠驗證數據集是否已被合理打包和傳遞。
• 數據復制和變更數據捕獲 – – 面對不斷增長的數據量,數據交付瓶頸導致企業無法在指定時段內控制數據的可訪問性和數據交付,尤其是在從源系統定期提取數據期間以及向數據倉庫中加載數據期間。數據復制技術可快速批量傳輸大型數據集。您可使用名為“變更數據捕獲”的方法來監視系統日志并在源系統發生變化時觸發更新目標系統。從而通過源源不斷地饋送數據變更來實現進程同步。
數據虛擬化
當用戶日益需要訪問采用不同結構和格式的大量來源的數據時,高效數據集成可幫助應對某些相關挑戰。但仍然無法解決及時一致地填充數據倉庫以滿足消費系統性能要求等問題。您在執行同步提取和轉換數據的復雜任務時,您會遇到定時和同步問題,從而導致數據使用者與原始的源系統之間無法保持一致。
您可嘗試通過縮短數據感知延遲和減小異步程度來解決此問題。數據虛擬化技術已經發展成熟,能夠幫您排除這些顧慮。數據虛擬化工具和技術可提供以下三項主要功能:
• 聯合 – – 這項功能可將標準或規范數據模型映射至面向包含聯合模型的各類數據源的訪問方法中,從而實現異構源的聯合。
• 緩存 – – 通過在虛擬(“緩存”)環境中管理訪問和聚合數據,數據虛擬化可縮短數據延遲,從而提高系統性能。
• 一致性 – – 聯合和虛擬化功能結合在一起,可提取數據訪問方法并將其與數據驗證、清理和統一標準結合使用。
虛擬化數據環境可簡化最終用戶應用和業務數據分析人員的數據訪問方式,無需他們了解源數據位置、數據集成或相關業務規則。
事件流處理
傳統的商業智能系統可能不足以將實時事件信息的主動捕獲、監控和關聯轉化為切實可用的知識。如想解決這個問題,您可通過名為“事件流處理”(ESP)的技術對流經信息流的事件之模式和序列進行實時監控。
ESP系統能幫企業快速響應因多個信息流匯合而帶來的新機遇。這些系統允許信息管理專業人員模擬企業內部用戶如何受到多個不同數據輸入流的影響,并對觸發產生心儀結果的模式進行分析。ESP系統可根據預期模式持續(實時)監控具有潛在影響的所有事件流,并能在指定的事件發生期內實現低延遲和事件處理。當發現實際情況與預期存在出入或新機會時,該系統可向適當人員發出警報,以便他們迅速采取行動,速度之快遠非傳統的數據分析工具可比。
ESP網絡可以監視來自多個輸入數據源的大量數據,具有極低的事件處理延遲。ESP系統具有延遲低和分析周轉短等特點,能通過可擴展的方式持續監控大量的流數據源,從而允許您識別出并響應新情況。實質上,您可使用ESP針對許多既定模式同時搜索大量動態數據,無需對靜態數據執行動態查詢。
元數據管理
跨職能部門的數據共享與交換暴露了與各部門獨立設計、開發和實施的數據系統相關的固有的不一致問題。鑒于早期的元數據管理方法只關注于數據模型的結構和技術層面(不考慮與業務相關的含義和語義),導致元數據管理項目經常徘徊不前?,F代化企業信息管理環境必須能夠實現業務導向的元數據管理,包括以下工具和方法:
• 業務術語詞匯表,用于捕獲常用的業務術語及其權威定義
• 數據標準,如命名慣例、既定的參考數據集、以及數據存儲和交換標準
• 數據元素定義,用于反映數據與業務術語的關聯性并提供上下文相關的定義以在業務應用中使用
• 數據譜系,用于顯示數據元素概念與其在不同模型和應用中的表示法之間的關系
• 與數據治理策略相集成,以支持驗證、合規性和控制
數據質量管理
數據質量管理的最佳業務實踐旨在幫助企業提高識別數據缺陷和錯誤的精準度,并簡化對數據缺陷根源的分析和修復流程。與此同時,數據質量保證工具和技術必須允許用戶實現數據標準化,并在可能的情況下糾正錯誤數據、實時標記出新發現的問題、通知適當的數據管理員、并促成企業與源數據提供商就潛在數據問題進行交流。納入以下技術的正式的數據質量管理框架可幫您實現上述目標:
• 數據解析和標準化 - 掃描數據值,旨在將非標準表示法轉換為標準格式。
• 數據糾正和清理 - 應用數據質量規則來糾正已發現的數據錯誤,從而清理數據并消除不一致性。
• 數據質量規則管理 - 集中管理數據質量要求和規則,以驗證數據是否符合預期規定。
• 數據質量評估和報告 - 提供服務調用框架,以根據數據規則來驗證數據并報告異常和數據缺陷。
• 標準化數據集成驗證 - 持續驗證現有的數據集成流程并對新開發的數據集成流程實施嵌入式驗證。
• 數據質量評估 - 使用數據分析和其他統計工具來評估源數據和數據問題,以識別出潛在的數據質量規則。
• 事故管理 - 數據質量事故管理的標準化方法(報告、分析/評估、分配優先級、補救、跟蹤)。
數據治理
最后,如果缺少數據規則驗證技術及數據政策合規保障技術,任何的現代化企業信息管理環境都將是不完整的。現代化企業信息管理環境至少應能通過適當工具來管理數據政策的整個生命周期,包括起草策略、向數據治理委員會提出策略、審查與修訂、審批、以及規則的實際應用等。
這些任務必須與組織系統開發生命周期中的設計和開發任務保持一致。這一點適用于信息管理的整個生命周期,從數據使用者的需求分析與匯總、到概念建模、邏輯和物理設計、以及后續實施。