隨著性觀念的開放,大家的觀念都很開放了,比如現在上海的拆奶罩(ChinaJoy)展會上,無數的ShowGirls的“秀溝”行為,活脫脫的辦成了一個硅膠展。西瓜哥對這種乳溝隆胸秀的行為非常氣憤,怎么不在北京搞一場,弄得我都沒有機會看看。
不說了,現在的青年男女嘛也是很開放,高校都可以結婚了。哎,西瓜哥又沒有趕上好時候。但年輕人嘛,容易一時沖動,偶爾可能邪惡了一把。
但是邪惡過后發現慘了,忘記做保護措施了。因此,做無痛人流的廣告現在都發到高校了。當然,無痛人流的廣告也充斥著電視、電梯甚至電線桿。因此,小孩子都懂。網上流傳的一個笑話是這樣的:
朋友研究生畢業,找不到合適工作,一日在家正發愁。
小侄子走近說:“叔叔,你去做個人流吧。”
朋友驚問“為什么?”
答:“廣播上說今天做人流明天就可以上班。”……
這個無痛人流廣告做的太好了,可把不少人都害慘了。無數的慘痛經歷告訴我們,還是應該選擇正規的機構。
在存儲界,也上演了相似的一幕。
隨著存儲競爭的白熱化,新的存儲廠商采用激進的價格攻勢和也許夸大的功能搶占市場,忽悠用戶拋棄舊的存儲,購買他們的新存儲。因此,大量的數據遷移(數據流動)產生了,就算是同一個廠商,由于更新換代,也可能造成復雜的數據遷移問題。隨著存儲技術的發展,很多廠商開始宣傳無痛的數據遷移過程,就如無痛人流一樣,吸引了很多用戶的注意力。
這些新技術的出現,使得“無痛數流”成為現實,甚至可以實現不中斷業務的數據遷移。今天,西瓜哥就來談談市場上常見的無痛遷移的技術。
根據IDC的統計,大企業有60%的IT項目是數據遷移,其中又只有60%的數據遷移項目能夠按時完成。根據451 Research公司的研究,企業有 一半的IT費用用在運維方面。因此,如何進行無痛的數據遷移就是對企業非常有意義的一個話題,怪不得現在無痛遷移比無痛人流還火。
數據遷移市場目前常用的主流手段還是基于主機的遷移,第二是采用虛擬化網關,第三是用存儲本身的復制技術。
遷移的風險,用戶最擔心的就是非計劃的停機,第二是遷移的成本超過預算,第三是對公司品牌和公共形象的影響。
從技術的角度,遷移最頭痛的原因有:
復雜性。現在的存儲環境很復雜,各種網絡連接技術,陣列上實現的各種增值功能,使得遷移后能否保持原有功能變得更加不確定。
技術依賴性。系統的軟硬件經過多年開發測試,兼容性很好。如果遷移到新存儲,其他相關的配套硬件和軟件是否可以工作,是一個問題。
業務依賴性。大部分的企業IT環境都是全天候工作,一個應用停止工作,可能影響到相關系統的正常運行。
規模。現在的遷移數據量都非常大,經常會達到PB級別。這個對遷移的時間和性能都是一個巨大的挑戰。
成本。遷移的成本是巨大的,經常會超過購買成本的一本以上。這個成本分析我們以前分享過,具體可以參看西瓜哥以前的帖子。
當然,這些問題主要是設備到設備間遷移的問題。如果遷移到公共云上,還有其他的問題,如安全問題等等。
還好,現在科技在發展。一些相關的遷移技術出現并且逐漸成熟。
陳列到陣列的遷移
陳列間的遷移主要就是塊協議數據的遷移,典型的方法有:
基于主機。數據在主機級別進行遷移,通過數據的卷到卷的復制,主機可以看到老的卷和新的卷。這個可以利用主機的邏輯卷管理功能來實現。
基于陣列。數據的移動使用陣列級的遷移工具。如果新舊設備是一個廠商的,用陣列的復制功能就可以了。如果是異構的遷移就比較麻煩了,但也有一些工具,如HP 3PAR Online Import可以支持把第三方的陣列的數據遷移到3PAR陣列上。EMC和華為也提供了類似的工具。
基于Hypervisor。服務器虛擬化現在都有能力實現VM的數據遷移,如 VMware's vSphere Storage vMotion和 Microsoft Hyper-V Live Migration。基于Hypervisor的遷移雖然需要增加License費用,但可以實現block到NFS的遷移,對業務的運維影響也比較少。
基于虛擬化網關。IBM的SVC,EMC的VPLEX和華為的VIS這些虛擬化網關都可以實現數據的遷移。大部分情況下需要中斷一下業務,把虛擬化網關接入到數據路徑中,然后就可以實現遷移。現在一些新興的存儲廠商已經實現了無中斷的數據遷移技術,可惜目前這些存儲大廠們都沒有集成進去。具體實現原理就是利用數據的多路徑技術,多條數據路徑順序逐步切換,保證系統的連續性。預計這些存儲大廠很快會收購或者自己開發這個不中斷業務的遷移功能,幫助用戶實現不停機遷移問題。
基于虛擬陣列。這個也容易理解,就如HDS的高端存儲VSP G1000,本身就集成了虛擬化網關的功能。
文件到文件的遷移
使用基于文件的協議,數據遷移也一樣復雜。文件共享一般采用統一命名空間來進行管理,如Microsoft的Distributed File System,抽取文件共享名并且使用全局命名空間,允許無縫的數據遷移。
對象存儲遷移
對象存儲現在非常流行,是保存非結構化數據的非常理想的方式。不僅僅用在云存儲方面,甚至很多地方也用來代替NAS設備。一般對象存儲都采用REST API接口來進行數據訪問和遷移。對象存儲一般采用糾刪碼或者多副本技術,任意節點的更換都不需要中斷業務。
遷移數據到公有云
使用混合云的企業越來越多。有許多的方法可以使用公有云,包括整個VM遷移到公有云或者把block或者file級別的數據遷移到云里。
需要云服務提供商提供VM導入功能,如Amazon Web Services' VM Import功能允許各種VM image導入到AWS中。不幸的是,這種方式限制比較多,因此現在比較常見的還是把數據遷移到全新的VM中。
現在EMC收購了一個云網關產品,將在VMAX3上集成云網關功能,可以把公有云作為數據的一層進行分層管理。而NETAPP也集成把數據遷移到Azure的能力。因此,傳統陣列和云網關結合是一個大趨勢。
Scale-out存儲和大數據
云和傳統的存儲不再是當今唯一的數據存儲平臺。我們看到scale-out存儲和數據湖泊(data lake)也用來存儲大量的數據。
開源的平臺如Ceph和Gluster提供scale-out文件和塊能力,數據遷移相對容易。節點可以按需增加或者減少。
Hadoop是一個最著名的流行大數據平臺,其內置工具DistCp可以用來在Hadoop集群間復制數據。當然,Hadoop不是真正為數據移動而設計的,因此把數據導入和遷出Hadoop集群不是給用戶一個文件系統或者LUN那么簡單。
新的架構一樣有新的遷移問題
從Facebook的經驗來看,大型的數據湖泊增長很快讓物理的數據中心空間成為問題,而集群的移動需要大量的規劃和努力。這讓我們的討論一下子又回到傳統存儲一樣的問題,即如果更簡單和減少成本。然而,新的存儲技術在管理數據移動性方面還相對幼稚,這將是一個巨大的創新領域,聚焦這方面的技術將變得更加流行。
雖然不是小公司看起來有很好的遷移技術,但遷移過程其實比人流還復雜。人流都需要選擇正規的機構,數據的遷移也是如此。技術是以方面,專業的遷移規劃和流程,包括應急措施,遷移的經驗也一樣重要。因此,數據遷移請選擇專業廠商的服務。
到那個時候,也許我們才有可能像無痛人流的廣告詞一樣說,“痛苦,再見!幸福重現!“。