如今,越來越多的組織需要在數據中心和云端之間移動數據,但在移動數據期間面臨停機的風險是一個難題。據調研機構451 Research數據,2018年約有60%的企業IT工作負載在某種形式的公共云或私有云上運行,而IDC,Gartner和Forrester的調查結果與此大致相同。
由此,IT領導者對數據移動的風險以及相關的停機時間表示擔憂也不足為奇。現在,企業數據庫的平均大小約為10到20年前的1000到100萬倍,這意味著與移動相關聯的潛在停機時間也會增加數倍。企業需要更多地利用云計算,以實施更具戰略性和智能的工作,包括高速,高容量的數據壓縮,以支持實時決策和復雜的自動化。而由之產生的數據量也使得建設二級數據中心成本過高,而這是進一步推動企業走向云計算的因素。
但是將業務數據從數據中心遷移到云端的痛苦仍然讓人望而卻步。他們的數據在運輸過程中可能會發生什么,如果他們無法再獲得訪問權限,或者如果在其他地方被使用,他們如何繼續使用實時數據?數據延遲也是一個問題。數據中心過去建在靠近企業經營的地方,以防止與網絡傳輸相關的性能下降。但是,隨著云計算的應用,數據中心之間的距離不在企業的控制之內,因此性能問題可能會減緩數據可用性和和協調性,這是一個重要的考慮因素。
未來將是現在
無論是日常的后臺系統,還是那些支持與人工智能或物聯網有關的雄心勃勃的新項目,組織都需要隨時需要正在處理的數據的可用性和完整性。
例如,對于無人駕駛汽車而言,所有各方(乘客,汽車制造商,保險公司和第三方服務提供商)都需要絕對的保證車輛儀表和傳感器,以及與之相連的云計算平臺將能夠持續實時發送,接收,解釋和處理數據。據估計,具有傳感器,相機和激光測量(LiDAR測量)的一臺自主駕駛車輛每秒可產生100Gb的數據。
使用不斷變化的數據集提供可行服務的唯一方法,無停機時間和無中斷,這是人們稱之為活動數據復制的方式。這允許實時數據同時存在于多個位置,而不會在每個終點被更新時不同步而有中斷的風險。這種能力將允許汽車制造商和服務合作伙伴分析和回應關于車輛運行情況的現場數據,實時識別異常情況,以及事先確定哪些必要的補救措施。
許多組織正在轉向采用基于Hadoop的分析(一種以速度進行大規模數據處理的特定方式),將大數據轉化為可以在日常活動中使用的有意義和可操作的事情。很多企業使用Hadoop來分析和回應Twitter的活動。但是,這通常意味著將數據放入云計算中,其中所需的處理能力隨時可用。
除非他們正在處理歷史數據,否則企業將繼續需要訪問其核心業務系統中的數據,其中記錄將繼續更新。在這種情況下,使用云計算進行處理并不是簡單的將批量裝載的完整數據發送到目的地,這是巧妙發生的事情。
暫停不是一個選項
當對實時的生產數據進行分析時,企業無法承受數據來源的站點和數據處理點不同步。他們在任何新的事情發生之前,不能等待幾天才能移動,分析和返回數據。這不僅僅是停機,而且是系統癱瘓。而且,這并不影響在遷移過程中可能發生的任何損壞或Hadoop分析事件后數據被協調的結果。
同樣,避免與數據移動相關的停機和中斷的唯一方法是找到一種在位置之間持續更新和同步數據的方法。谷歌公司通過精心制作的衛星設置實現了這一點,而企業也可以使用文中介紹的這樣的巧妙算法來實施。