《企業網D1Net》3月21日訊
實現數據虛擬化已經成為很多企業的公式,對于企業而言,數據虛擬化能夠克服軟件和硬件的復雜性,并為企業提高IT靈活性和顯著節省開支提供了極好的機會。
隨著越來越多的企業尋求這種好處,數據虛擬化正在迅速從新的想法變成主流的應用。下面是早期應用者常犯的四個錯誤,希望能夠作為一些客觀的教訓幫助企業加快實現數據虛擬化可能帶來的潛在的好處。
錯誤1:過多地進行虛擬化
數據虛擬化與存儲、服務器和應用程序虛擬化類似,提供了極好的利潤收益。例如,一家能源公司使用數據虛擬化把實時的油田數據與每天晚上的綜合倉儲信息結合起來把每天的原油產量提高了數千桶。一家金融公司把新的應用的開發時間減少了50%。同時,另一家金融服務公司每年節省了200萬美元的商務智能和報告成本。
然而,數據虛擬化不是每一個數據整合問題的解決方案。例如,當消費應用程序需要從多個角度進行分析的時候,或者當數據在消費之前需要進行重大轉變的時候,物理的數據整合是更好的方法。
為了避免對任何具體開發項目過多地進行虛擬化,首先要更好地理解這個業務、數據資源和數據消費者的特點。
錯誤2:虛擬化不夠
第一個錯誤的反面是虛擬化不夠。按常規辦事,而不是尋求最佳的方法,是每一個人都做的事情。在90年代,物理數據整合的發展出現了單獨的、整合的存儲和特殊的ETL(提取、轉換和裝載)中間件軟件。到2000年之后,ETL成為了默認的數據證據整合范例。但是,它應該是唯一的方法嗎·
虛擬化不足會增加大量的成本,因為物理的數據整合需要時間更長的解決方案、更昂貴的開發和操作成本和更低的業務和IT靈活性(由于包含額外的開銷)。幸運的是,避免這個錯誤的做法是在數據整合決策過程中認真分析和定義要求,以保證最佳的解決方案滿足這些要求,而不是讓傳統的做法推動這個決策。
錯誤3:錯誤混合的機會
在許多情況下,最佳的數據整合解決方案是把虛擬和物理的方法結合起來。沒有理由鎖定這一種方法或者那一種方法。圖2展示了混合使用的例子,并且對這些例子進行了說明。
·物理數據倉儲/或者數據集市方案擴展:這是擴展現有的方案的方法,如把當前的操作數據增加到歷史庫中。
·物理倉儲、集市和/或者聯合存儲:這是把多種物理整合的資源聯合在一起的方法,例如合并之后的2個或者3個銷售數據集。
·數據倉儲和/或者數據集市原型產品:這種方法是推出新的倉儲或者數據集市的原型產品,加快早期階段的實施,從而進入更大規模的商務智能計劃,
·數據倉儲和/或者數據集市源數據接入:這是向數據倉儲和數據集市提供虛擬訪問數據源的一個方法,如當前的ETL工具不容易提供技術支持的XML或者包裝的應用程序。
·消除數據集市:這是用虛擬的東西消除或者取代物理的數據集市的一種方法,如通過提供方便的和更節省成本的虛擬化選擇阻止惡意的數據集市的擴散。
錯誤4:假定完美的數據是先決條件
糟糕的數據質量是目前企業存在的一個普遍的問題。雖然糾正和完善源數據是最終的目標,但是,我們在物理數據整合的轉換和整合階段清理倉庫中數據的時候仍然會留下一些沒有處理的數據。
當數據質量問題是反應各個系統中的實施細節的簡單的格式沖突問題的時候,數據虛擬化解決方案能夠輕松解決這些常見的數據沖突問題,不會對性能產生任何影像。一些例子包括,在一個源系統中的Part_id字段讀作VARCHAR,而同樣的字段在另一個源系統中讀作INTEGER?;蛘咴谝粋€系統中的銷售區與另一個系統中的銷售區不匹配。如果需要執行繁重的清理工作,在運行時采用專業的數據質量解決方案通常能夠滿足業務需求,同時打開數據虛擬化的機會。
D1Net評論:
實現數據虛擬化,為企業帶來的好處是顯而易見的,因此企業對數據虛擬化非常熱衷,通過熟悉需要避免的常見錯誤,企業將獲得在數據整合基礎設施中成功地實施數據虛擬化所需要的智慧,從而收獲數據虛擬化帶來的好處。