云存儲(chǔ)是一個(gè)非常有吸引力的將日常數(shù)據(jù)管理外包的服務(wù),但是,一旦數(shù)據(jù)丟失,所有的后果都將由擁有此數(shù)據(jù)的公司承擔(dān),而不是托管服務(wù)提供商。考慮到這一點(diǎn),了解數(shù)據(jù)丟失的原因、云服務(wù)提供商承擔(dān)多少責(zé)任、安全利用云存儲(chǔ)的一些基本方法以及不管數(shù)據(jù)是存儲(chǔ)在本地還是云端的完整性監(jiān)測方法和標(biāo)準(zhǔn)就顯得非常重要。
完整性監(jiān)測在云存儲(chǔ)服務(wù)中是必不可少的,同樣,數(shù)據(jù)完整性也是所有數(shù)據(jù)中心最核心的任務(wù)。任何級(jí)別的存儲(chǔ)和任何類型的媒質(zhì)都有可能發(fā)生數(shù)據(jù)損壞。位衰減(存儲(chǔ)介質(zhì)上的數(shù)據(jù)減弱或丟失)、控制器故障、重復(fù)數(shù)據(jù)刪除元數(shù)據(jù)損壞、磁帶故障是導(dǎo)致不同類型媒質(zhì)數(shù)據(jù)損壞的主要因素。元數(shù)據(jù)損壞是上述故障導(dǎo)致的直接結(jié)果,比如位衰減,并且也極其容易受到除硬件錯(cuò)誤率以外的軟件故障的影響。不幸的是,重復(fù)數(shù)據(jù)刪除的一個(gè)副作用是,損壞的文件、塊(block)或字節(jié)將影響到每一塊與之相關(guān)聯(lián)的元數(shù)據(jù)。事實(shí)上,存儲(chǔ)壞境內(nèi)的任何一個(gè)環(huán)節(jié)都有可能發(fā)生數(shù)據(jù)損壞。將數(shù)據(jù)遷移到不同的平臺(tái)過程中很容易就被損壞,即將數(shù)據(jù)遷移到云端。云存儲(chǔ)系統(tǒng)也是由硬件和軟件組成的數(shù)據(jù)中心,其也容易受到攻擊而導(dǎo)致數(shù)據(jù)損壞。比如最近廣為人知的亞馬遜云宕機(jī)事件。許多企業(yè)不僅受到長時(shí)間的宕機(jī)影響,實(shí)際上,他們0.07%的客戶數(shù)據(jù)已經(jīng)丟失。據(jù)報(bào)道,引發(fā)數(shù)據(jù)丟失的原因是“亞馬遜ESB卷……不一致的數(shù)據(jù)快照恢復(fù)。”這就意味著亞馬遜系統(tǒng)中的數(shù)據(jù)已經(jīng)損壞,因此,客戶數(shù)據(jù)已經(jīng)丟失。每當(dāng)數(shù)據(jù)丟失,尤其是重要數(shù)據(jù)丟失,人們傾向于相互指責(zé)以推脫責(zé)任。在IT行業(yè),這通常會(huì)導(dǎo)致工作人員被解雇、公司承受巨大經(jīng)濟(jì)損失,甚至最嚴(yán)重的情況是企業(yè)破產(chǎn)。因此,關(guān)鍵是要了解云服務(wù)提供商要承擔(dān)的法律責(zé)任,以及每個(gè)服務(wù)水平協(xié)議(SLA)已采取一切可能的措施以確保數(shù)據(jù)的安全,防止數(shù)據(jù)丟失。就很多法律文件來說,SLA大多偏向于提供商的利益,而不是客戶的利益。許多云服務(wù)提供商都提供了不同層次的數(shù)據(jù)保護(hù),但是,所有的存儲(chǔ)供應(yīng)商都不對(duì)數(shù)據(jù)完整性承擔(dān)責(zé)任。
云SLA協(xié)議,包括云提供商的保護(hù)都明確表明,數(shù)據(jù)丟失或損壞是最常見的情況。比如亞馬遜的客戶web服務(wù)協(xié)議,其中規(guī)定,“我們……不提供任何形式的聲明或保證,所提供的服務(wù)或第三方內(nèi)容是不間斷的、無差錯(cuò)的、無故障部件的,或任何內(nèi)容…將是安全的、不丟失的或無損壞的。”這個(gè)協(xié)議甚至據(jù)以建議客戶“頻繁歸檔”他們的數(shù)據(jù)。如前所述,數(shù)據(jù)的完整性管理,無論其是在數(shù)據(jù)中心、私有云、混合云或公共云,其責(zé)任總是要該數(shù)據(jù)的實(shí)際擁有公司來承擔(dān)。
一些共通的最佳方式將允許公司利用云的靈活性和易接近性的優(yōu)點(diǎn),而又不會(huì)危及其數(shù)據(jù)安全。在數(shù)據(jù)保護(hù)的前提下分散風(fēng)險(xiǎn),將數(shù)據(jù)丟失的可能性降到最低。即使是在云端存儲(chǔ)數(shù)據(jù),保留一個(gè)主副本和現(xiàn)場數(shù)據(jù)的備份副本也是很有意義的,這樣的話,訪問數(shù)據(jù)就不會(huì)依賴于網(wǎng)絡(luò)性能或連通性。堅(jiān)持這些基本的最佳做法,了解云服務(wù)提供商SLA的細(xì)節(jié),適當(dāng)構(gòu)建模塊以主動(dòng)監(jiān)測數(shù)據(jù)的完整性,無論其是存儲(chǔ)在云端或是本地。
驗(yàn)證一組數(shù)據(jù)的完整性的方法之一基于哈希值。哈希值是根據(jù)一個(gè)預(yù)定義的方式壓縮一組數(shù)據(jù)而得到的一個(gè)獨(dú)特的值。由于哈希值是從原始數(shù)據(jù)本身獲得的,如果兩個(gè)哈希值不完全相同,其就意味著這兩個(gè)副本至少有一個(gè)已被更改或損壞。
確保云提供商無論何時(shí)何地存儲(chǔ)副本,都能夠提供數(shù)據(jù)的哈希值核對(duì),并與第二個(gè)數(shù)據(jù)副本的哈希值進(jìn)行比較。人工進(jìn)行這個(gè)級(jí)別的數(shù)據(jù)監(jiān)測將非常繁瑣。幸運(yùn)的是還有其他的方法可用,包括標(biāo)題檢查。Spectra Logic公司和 其他動(dòng)態(tài)歸檔聯(lián)盟(Active Archive Alliance)成員都提供自動(dòng)監(jiān)測系統(tǒng)內(nèi)數(shù)據(jù)完整性工具。
雖然動(dòng)態(tài)歸檔是監(jiān)測數(shù)據(jù)完整性的方法之一,但其仍需要目前廣泛采用的云標(biāo)準(zhǔn)協(xié)議支持其完整性監(jiān)測和互操作性。因?yàn)椴⒉皇撬械臄?shù)據(jù)中心或云托管基礎(chǔ)設(shè)施都采用的同一標(biāo)準(zhǔn)的設(shè)備,不同存儲(chǔ)設(shè)備之間的互操作性至關(guān)重要。云存儲(chǔ)管理接口(CDMI)標(biāo)準(zhǔn)是全球網(wǎng)絡(luò)存儲(chǔ)工業(yè)協(xié)會(huì)(SNIA)在2010年提出來的。兼容CDMI的系統(tǒng)可能查詢另一個(gè)兼容CDMI的系統(tǒng)的對(duì)象的哈希值,以此驗(yàn)證兩個(gè)數(shù)據(jù)副本是否相同。通過監(jiān)測主數(shù)據(jù)副本和備份副本的完整性,企業(yè)可以確認(rèn)存儲(chǔ)在云端的數(shù)據(jù)副本是否損壞。可以通過數(shù)據(jù)值來頻繁地監(jiān)測這些數(shù)據(jù)集。諸如CDMI之類的行業(yè)標(biāo)準(zhǔn),其不僅能確保異構(gòu)兼容系統(tǒng)之間的互操作性,并且還給數(shù)據(jù)完整性監(jiān)測提供了便利機(jī)制。
最近很難看到云行業(yè)在媒體上出現(xiàn),特別是Iron Mountain公司停止了他們最基本的云存儲(chǔ)服務(wù)和預(yù)先討論的亞馬遜宕機(jī)事件之后。但是,這篇文章的宗旨不在于討論云存儲(chǔ)平臺(tái)是否明智,而是在研究和實(shí)施云戰(zhàn)略時(shí),應(yīng)考慮更多的因素,而不是僅簡單地考慮每GB的存儲(chǔ)成本。如果云存儲(chǔ)實(shí)施正確,將給所有的企業(yè)提供許多的利益。消除云劣勢需要智能數(shù)據(jù)管理戰(zhàn)略。不管在何處或怎樣存儲(chǔ)數(shù)據(jù),在需要時(shí),其可訪問和可恢復(fù)絕對(duì)是至關(guān)重要的。這個(gè)承諾是所有數(shù)據(jù)完整性監(jiān)測和驗(yàn)證的核心任務(wù)。