數據虛擬化克服硬件和軟件復雜性的能力為企業提高IT靈活性和顯著節省開支提供了極好的機會。隨著越來越多的企業尋求這種好處,數據虛擬化正在迅速從新的想法變成主流的應用。下面是早期應用者常犯的十個錯誤,希望能夠作為一些客觀的教訓幫助企業加快實現數據虛擬化可能帶來的潛在的好處。
錯誤1:過多地進行虛擬化
數據虛擬化與存儲、服務器和應用程序虛擬化類似,提供了極好的利潤收益。例如,一家能源公司使用數據虛擬化把實時的油田數據與每天晚上的綜合倉儲信息結合起來把每天的原油產量提高了數千桶。一家金融公司把新的應用的開發時間減少了50%。同時,另一家金融服務公司每年節省了200萬美元的商務智能和報告成本。
然而,數據虛擬化不是每一個數據整合問題的解決方案。例如,當消費應用程序需要從多個角度進行分析的時候,或者當數據在消費之前需要進行重大轉變的時候,物理的數據整合是更好的方法。
為了避免對任何具體開發項目過多地進行虛擬化,首先要更好地理解這個業務、數據資源和數據消費者的特點。
錯誤2:虛擬化不夠
第一個錯誤的反面是虛擬化不夠。按常規辦事,而不是尋求最佳的方法,是每一個人都做的事情。在90年代,物理數據整合的發展出現了單獨的、整合的存儲和特殊的ETL(提取、轉換和裝載)中間件軟件。到2000年之后,ETL成為了默認的數據證據整合范例。但是,它應該是唯一的方法嗎·
虛擬化不足會增加大量的成本,因為物理的數據整合需要時間更長的解決方案、更昂貴的開發和操作成本和更低的業務和IT靈活性(由于包含額外的開銷)。幸運的是,避免這個錯誤的做法是在數據整合決策過程中認真分析和定義要求,以保證最佳的解決方案滿足這些要求,而不是讓傳統的做法推動這個決策。
錯誤3:錯誤混合的機會
在許多情況下,最佳的數據整合解決方案是把虛擬和物理的方法結合起來。沒有理由鎖定這一種方法或者那一種方法。圖2展示了混合使用的例子,并且對這些例子進行了說明。
·物理數據倉儲/或者數據集市方案擴展:這是擴展現有的方案的方法,如把當前的操作數據增加到歷史庫中。
·物理倉儲、集市和/或者聯合存儲:這是把多種物理整合的資源聯合在一起的方法,例如合并之后的2個或者3個銷售數據集。
·數據倉儲和/或者數據集市原型產品:這種方法是推出新的倉儲或者數據集市的原型產品,加快早期階段的實施,從而進入更大規模的商務智能計劃,
·數據倉儲和/或者數據集市源數據接入:這是向數據倉儲和數據集市提供虛擬訪問數據源的一個方法,如當前的ETL工具不容易提供技術支持的XML或者包裝的應用程序。
·消除數據集市:這是用虛擬的東西消除或者取代物理的數據集市的一種方法,如通過提供方便的和更節省成本的虛擬化選擇阻止惡意的數據集市的擴散。
錯誤4:假定完美的數據是先決條件
糟糕的數據質量是目前企業存在的一個普遍的問題。雖然糾正和完善源數據是最終的目標,但是,我們在物理數據整合的轉換和整合階段清理倉庫中數據的時候仍然會留下一些沒有處理的數據。
當數據質量問題是反應各個系統中的實施細節的簡單的格式沖突問題的時候,數據虛擬化解決方案能夠輕松解決這些常見的數據沖突問題,不會對性能產生任何影像。一些例子包括,在一個源系統中的Part_id字段讀作VARCHAR,而同樣的字段在另一個源系統中讀作INTEGER。或者在一個系統中的銷售區與另一個系統中的銷售區不匹配。如果需要執行繁重的清理工作,在運行時采用專業的數據質量解決方案通常能夠滿足業務需求,同時打開數據虛擬化的機會。
錯誤5:預計對操作系統產生負面影響
雖然操作系統通常是在虛擬化數據時使用的主數據源之一,這些系統的運行時性能一般不是受到影響的結果。因此,設計師一直在物理存儲的數據量和每天晚上進行的提取、轉換和裝載操作的數據吞吐量。當使用虛擬化的方法時,設計人員應該考慮最終解決方案在每一次查詢時實際查詢的數據量和這些查詢實施的頻繁程度。如果這些查詢相對較小(例如1萬行)和查詢范圍比較廣(涉及到多個系統或者表格),或者運行次數不是很頻繁(如每天運行幾百次),那么,這對操作系統的影像是比較輕的。
系統設計師和架構師預計對操作系統產生負面影像一般是低估了最新的虛擬化解決方案的速度。利用一些時間計算需要的數據負荷有助于避免對操作系統產生潛在的影像的錯誤判斷。
錯誤6:沒有簡化問題
當企業數據環境是可以理解的非常復雜的時候,開發復雜的數據虛擬化解決方案通常是不必要的。大多數成功的數據虛擬化項目都分成較小的組件,每一個組件解決整個需求的一部分問題。這種簡化可以采用兩種方法:利用工具和利用合適的整合組件。
數據虛擬化工具幫助解決數據整合方面的三個基本難題:
1.數據位置:數據位于多個位置和來源。
2.數據結構:數據并不總是處于需要的格式。
3.數據完整性:數據經常需要與其它數據結合在一起才有意義。
數據虛擬化中間件軟件能夠解決數據位置的難題,方法是讓所有的數據好像都來自同一個地方,而不是這些數據實際存儲的地方。
數據提取可以簡化數據的復雜性,方法是把數據結構和句法轉換成為商業解決方案開發人員容易理解和商業解決方案消費的可以重復使用的視圖和Web服務。
數據聯合把數據結合在一起組成更有意義的商業信息,產生一個客戶的單個視圖或者一個庫存平衡組合服務。
成功的合適尺寸的數據整合組件需要聰明地分解各種需求。最近,包括Composite Software公司在內的五家廠商的專家共同發表了一個“SOA實施者指南”,提出了三個級別的虛擬化數據服務,讓設計師和架構師設計如下更小的和更容易管理的數據集成組件:
·物理服務:物理服務位于數據源上面,把數據轉換為更高一級服務能夠輕松消費的格式。
·商業服務:商業服務體現了轉換邏輯的大部分功能,把數據從物理格式轉換為所需要的商業格式。
·應用服務:應用服務利用商業服務向消費的應用程序提供優化的數據。這樣,解決方案開發人員能夠按照這些簡單的和重點的數據服務進行設計,從而簡化當前開發工作的努力,為將來提供更大的再利用和靈活性。
錯誤7:把SQL/關系數據庫和XML/分層數據當作隔離的豎井
從歷史上看,數據整合一直把重點放在支持商業智能應用程序的需求方面,而流程整合的重點是優化商務流程。這兩種不同的方法產生了不同的架構、工具、中間件軟件、方法、團隊等等。然而,由于今天的數據虛擬化中間件軟件通常適合關系和分層數據,把這些關鍵的數據格式隔離開來是錯誤的。這在需要SQL和XML組合的時候是非常重要的,例如,當把外部工資單處理器的數據與內部銷售隊伍自動化系統的關系數據結合在一起在一個銷售代表的效績門戶的單個窗口中提供XML數據的時候。
無論你的數據類型是什么,統一的方法不僅能夠提供更好的解決方案,而且,開發人員和設計師還能夠獲得其傳統的核心技術領域以外的經驗。
錯誤8:使用錯誤的基礎設施實施數據虛擬化
在SOA(面向服務的架構)環境中的數據服務的松散耦合是數據虛擬化的極好應用。因此,SOA是數據虛擬化最頻繁使用的案例之一。然而,有時候對于什么時候部署企業服務總線中間件軟件和什么時候使用信息服務器設計和運行需要的數據服務還存在一些混淆的認識。
企業服務總線善于協調各種交易和數據服務。然而,企業服務總線不支持繁重任務的數據功能,如高性能查詢、復雜的聯合、XML/SQL轉換等目前企業應用軟件使用實例中需要的功能。另一方面。數據虛擬化工具提供一種使用方便的、高效率的數據服務開發環境和高性能、高可靠性運行時信息服務器以滿足設計和運行時需求。然后,企業服務總線能夠根據需求協調這些服務。
錯誤9:把數據虛擬化人員與流程隔離開
隨著物理數據整合技術和方法的成熟,以集成能力中心(ICC)以及最佳做法和流程等方式存在的技術支持機構已經增加了支持。這些中心提高開發人員的效率,優化工具使用,減少項目風險以及做其它一些事情。
認為不能或者不應該利用這些ICC支持數據虛擬化是錯誤的。通過采用數據虛擬化,ICC在人員和流程資源的配合下能夠把數據虛擬化的技術價值組合起來。
錯誤10:不能發展和共享好處
雖然數據虛擬化能夠加快新的開發,執行更快的迭代轉變,減少開發和運營成本,但是,以為這些好處能夠自己推銷自己是錯誤的,特別是在新技術投資需要嚴格審查的艱難的商業時期。
幸運的是這些好處能夠(和應該)衡量和共享的。下面是完成這個任務的一些想法:
·首先使用以前介紹的虛擬的和物理的集成工具找出一些數據虛擬化候選項目作為一個試驗項目。
·在這些項目處在設計和開發階段的時候,跟蹤它使用數據虛擬化的時間,并且與它使用傳統的物理方法所有的時間進行對比。
·使用這種節省時間的情況計算兩個額外的價值點:解決方案減少的時間和節省的開發成本。
·要衡量生命周期的價值,預測由于虛擬化額外的物理數據存儲節省的運營成本。
·為更快的從故障修復中恢復正常和增強的開發活動中預計節省的開發生命周期成本增加這些硬件操作成本。
·最后,把這些試驗項目的結果綜合在一起推斷未來的項目結果,并且把這種推斷通報給業務和IT部門的領導人。
行業分析師一致認為,最佳做法的領導人從包含虛擬和物理數據整合工具的產品組合中吸取經驗以滿足當前企業不斷變化的信息需求。廣泛的行業和政府機構的多個應用實例說明了數據虛擬化的益處。這些益處包括減少解決方案推出的時間、減少實施和維護的整個成本、以及適應變化的更大的靈活性。通過熟悉需要避免的常見錯誤,企業將獲得在數據整合基礎設施中成功地實施數據虛擬化所需要的智慧,從而收獲數據虛擬化帶來的好處。