數(shù)據(jù)遷移是一個復(fù)雜且通常成本高昂的過程。企業(yè)將需要正確的方法來準(zhǔn)確無誤地遷移數(shù)據(jù),其中包括深思熟慮的策略和適當(dāng)?shù)墓ぞ摺?
什么是數(shù)據(jù)遷移?
數(shù)據(jù)遷移是指將數(shù)據(jù)從一個存儲系統(tǒng)傳輸?shù)搅硪粋€存儲系統(tǒng)的過程。它從數(shù)據(jù)選擇和準(zhǔn)備開始,在此期間進(jìn)行提取和轉(zhuǎn)換。在執(zhí)行這一步驟之后,可以將永久數(shù)據(jù)從舊存儲系統(tǒng)中選擇并加載到適當(dāng)?shù)臄?shù)據(jù)存儲系統(tǒng)中。然后,數(shù)據(jù)遷移將以舊存儲系統(tǒng)的退役而結(jié)束。
數(shù)據(jù)遷移通常屬于以下兩類:
·云遷移:數(shù)據(jù)或應(yīng)用程序從物理存儲系統(tǒng)遷移到云平臺或在兩個云平臺之間遷移。
·數(shù)據(jù)中心遷移:數(shù)據(jù)從一個內(nèi)部部署數(shù)據(jù)中心遷移到另一個數(shù)據(jù)中心以進(jìn)行升級或重新定位。
在決定要遷移到哪里之后,接下來需要確定需要遷移的內(nèi)容:
·存儲遷移:數(shù)據(jù)從一種物理存儲解決方案移動到另一種。
·數(shù)據(jù)庫遷移:使用數(shù)據(jù)庫管理系統(tǒng)移動結(jié)構(gòu)化或數(shù)據(jù)庫管理的數(shù)據(jù)。
·應(yīng)用程序遷移:數(shù)據(jù)從一個計(jì)算環(huán)境遷移到另一個計(jì)算環(huán)境,以支持應(yīng)用程序軟件的變化。
·業(yè)務(wù)流程遷移:遷移與業(yè)務(wù)流程和指標(biāo)相關(guān)的業(yè)務(wù)應(yīng)用程序和數(shù)據(jù)。
為什么需要數(shù)據(jù)遷移?
企業(yè)選擇升級其存儲系統(tǒng)并隨之遷移數(shù)據(jù)有幾個原因,最終幫助他們獲得競爭優(yōu)勢。數(shù)據(jù)庫遷移可幫助企業(yè)克服存儲限制,并可以促進(jìn)更好的數(shù)據(jù)管理功能和處理速度。另一方面,存儲遷移主要集中在升級以支持新技術(shù)。
企業(yè)可能會發(fā)現(xiàn)需要進(jìn)行數(shù)據(jù)遷移的其他場景包括:
·希望升級到新的基礎(chǔ)設(shè)施以彌補(bǔ)規(guī)模限制。
·希望優(yōu)化運(yùn)行數(shù)據(jù)中心的間接成本。
·需要在采集之后合并新數(shù)據(jù)。
·需要遷移數(shù)據(jù)中心。
·希望實(shí)施災(zāi)難恢復(fù)解決方案。
·希望將應(yīng)用程序遷移到云中,原因包括易于維護(hù)和訪問成本。
數(shù)據(jù)遷移的策略
提前制定戰(zhàn)略將幫助企業(yè)節(jié)省成本并防止停機(jī),以確保業(yè)務(wù)連續(xù)性。企業(yè)必須考慮限制并了解數(shù)據(jù)遷移項(xiàng)目的整體范圍。在啟動數(shù)據(jù)遷移項(xiàng)目之前,企業(yè)需要考慮兩個關(guān)鍵因素,即規(guī)模和時間。
·數(shù)據(jù)大小:大多數(shù)數(shù)據(jù)集規(guī)模太大而無法簡單地上傳到云端,需要在物理設(shè)備上傳送。這主要是因?yàn)樗俣群统杀鞠拗啤F髽I(yè)可以通過硬盤驅(qū)動器發(fā)送10TB以下的數(shù)據(jù),而PB范圍內(nèi)的較大數(shù)據(jù)則需要專門用于數(shù)據(jù)遷移的設(shè)備。
·時間限制:帶寬、網(wǎng)絡(luò)速度和限制以及數(shù)據(jù)集大小是計(jì)算數(shù)據(jù)遷移所需時間時的關(guān)鍵考慮因素。如果需要在物理設(shè)備上傳送數(shù)據(jù),則還應(yīng)考慮其傳輸時間。
在考慮數(shù)據(jù)大小和時間限制之后,企業(yè)可以制定項(xiàng)目預(yù)算和時間表,還需要決定用于數(shù)據(jù)庫遷移的工具和框架。這將為其概述數(shù)據(jù)遷移的整個過程。
此外,企業(yè)還需要決定遷移方法,即在“大爆炸”方法和“一蹴而就”方法之間進(jìn)行選擇;或選擇循序漸進(jìn)的方法,即分階段遷移,其中兩個系統(tǒng)同時運(yùn)行。
數(shù)據(jù)遷移的關(guān)鍵步驟
數(shù)據(jù)遷移是企業(yè)將要進(jìn)行的最關(guān)鍵的項(xiàng)目之一,每一步都需要認(rèn)真謹(jǐn)慎。其復(fù)雜性背后的原因是企業(yè)不想損害數(shù)據(jù)質(zhì)量,否則數(shù)據(jù)驅(qū)動的業(yè)務(wù)將在核心運(yùn)營中出現(xiàn)錯誤。
經(jīng)過規(guī)劃,數(shù)據(jù)遷移大致有五個階段:
(1)數(shù)據(jù)準(zhǔn)備涉及一些旨在使數(shù)據(jù)適合遷移的關(guān)鍵操作。從審計(jì)開始,將運(yùn)行一個自動化流程來分析數(shù)據(jù)質(zhì)量,并通知不一致、重復(fù)條目或健康狀況不佳的情況。接下來,備份文件并建立訪問級別。
(2)數(shù)據(jù)映射涉及匹配數(shù)據(jù)源和新目標(biāo)之間的數(shù)據(jù)字段匹配。
(3)執(zhí)行是數(shù)據(jù)被提取、處理和加載到目的地的地方。
(4)在理想情況下,測試是數(shù)據(jù)遷移中的一個連續(xù)過程,尤其是當(dāng)分階段遷移數(shù)據(jù)時。在整個遷移過程完成之后,需要運(yùn)行另一次自動化測試迭代,修復(fù)問題并繼續(xù)上線。
(5)有必要在數(shù)據(jù)上線后再次審核,以確保成功完成。企業(yè)還應(yīng)該及時進(jìn)行審計(jì)并監(jiān)控系統(tǒng)的運(yùn)行狀況。
遷移工具
有許多工具可以幫助企業(yè)完成遷移過程。許多云計(jì)算提供商提供自己的一套工具。其他工具,包括幾個免費(fèi)和開源應(yīng)用程序,例如Salesforce公司的DataLoader也可用。與遷移類型一樣,遷移工具可以是自腳本、內(nèi)部部署和基于云的。其他主要工具包括亞馬遜的AWS數(shù)據(jù)管道、IBM Informix和Microsoft Azure CosmosDB。
數(shù)據(jù)遷移的挑戰(zhàn)
數(shù)據(jù)遷移本質(zhì)上是復(fù)雜的,在企業(yè)中執(zhí)行這一項(xiàng)目時可能會遇到一些挑戰(zhàn)。
·不包括相關(guān)方可能會中斷企業(yè)的業(yè)務(wù)活動和數(shù)據(jù)遷移過程。每周讓他們更新進(jìn)度。
·缺乏數(shù)據(jù)治理或不清楚誰可以訪問源系統(tǒng)中的數(shù)據(jù),可能會造成混亂并影響數(shù)據(jù)質(zhì)量。一個明確定義的數(shù)據(jù)治理框架對于克服這一挑戰(zhàn)至關(guān)重要。
·通用且未經(jīng)證實(shí)的遷移方法可能弊大于利。始終尋找可靠的推薦支持服務(wù)提供商,并選擇經(jīng)驗(yàn)豐富的團(tuán)隊(duì)。
·技能不足和工具不足都會導(dǎo)致意外的延遲,并耗費(fèi)寶貴的時間。進(jìn)行適當(dāng)?shù)难芯浚_保負(fù)責(zé)數(shù)據(jù)遷移的團(tuán)隊(duì)得到充分的培訓(xùn),并擁有所有必要的工具。
·計(jì)劃是必不可少的。計(jì)劃本身可能不足以保證成功遷移,但卻是必要的。
準(zhǔn)備好遷移數(shù)據(jù)了嗎?
雖然數(shù)據(jù)遷移聽起來可能不會太令人生畏,但這是一個復(fù)雜的過程,必須事先弄清楚許多變量。因此,企業(yè)需要一個專門的團(tuán)隊(duì)來執(zhí)行和監(jiān)控數(shù)據(jù)遷移過程,并將其視為一個重大項(xiàng)目。
企業(yè)還可以利用多個高級和開源應(yīng)用程序來幫助進(jìn)行數(shù)據(jù)遷移。與遷移類型一樣,遷移工具可以是自腳本的、內(nèi)部部署的和基于云的,將為企業(yè)提供足夠的靈活性,以最適合的方式進(jìn)行數(shù)據(jù)遷移。
盡管這是一項(xiàng)艱巨的任務(wù),但只要考慮清楚,就可以毫不猶豫地繼續(xù)進(jìn)行。
版權(quán)聲明:本文為企業(yè)網(wǎng)D1Net編譯,轉(zhuǎn)載需注明出處為:企業(yè)網(wǎng)D1Net,如果不注明出處,企業(yè)網(wǎng)D1Net將保留追究其法律責(zé)任的權(quán)利。