云存儲聽上去是如此簡單。你只需為你所使用的支付費(fèi)用,并且在任何時(shí)候,都很容易判斷你使用的存儲量。然而,經(jīng)驗(yàn)豐富的IT專業(yè)人員都清楚,實(shí)施一項(xiàng)新技術(shù)或方法很少會如此簡單。
當(dāng)你部署云存儲資源時(shí),你需要制定優(yōu)化存儲使用的政策和程序。例如,對存儲對象進(jìn)行元數(shù)據(jù)標(biāo)簽,是很重要的,因?yàn)檫@將有助于實(shí)施細(xì)粒度的管理,和版本控制政策,以及降低存儲成本。同時(shí),考慮訪問控制和其他安全措施對云中存儲數(shù)據(jù)的影響。你應(yīng)該建立管理方案,充分利用云供應(yīng)商提供的工具,以及來自第三方的資源管理器,如CloudCheckr和Cloudyn。
元數(shù)據(jù)抑制浪費(fèi)
云存儲使一個(gè)企業(yè)能夠保存越來越大量的數(shù)據(jù),而不會產(chǎn)生過多的成本。然而,這可能會導(dǎo)致關(guān)注邊際成本的思維模式,然后使用更多的存儲空間。當(dāng)添加存儲的成本只有每十億字節(jié)幾美分時(shí),很容易忽略存儲最優(yōu)化。當(dāng)應(yīng)對相對較小的數(shù)據(jù)集時(shí),這很可能是一個(gè)可行的戰(zhàn)略,但是對于大規(guī)模的存儲需求,卻不是。
一個(gè)更有效的計(jì)劃是相對于已經(jīng)存儲的數(shù)據(jù),哪些新數(shù)據(jù)應(yīng)該被存儲。問問自己:一個(gè)包含客戶數(shù)據(jù)的分析單位,真的需要保留副本嗎?這可能取決于分析單位的類型。從存儲管理的角度來看,這是一種低效并且昂貴的方法。
分析師的情況則不同,他們需要了解所使用數(shù)據(jù)集的屬性。他們需要事實(shí),比如數(shù)據(jù)集的創(chuàng)建日期、最初的數(shù)據(jù)源和相關(guān)轉(zhuǎn)換,和屬性的描述,包括創(chuàng)建派生值的公式。與其期望由其他分析團(tuán)體創(chuàng)建的數(shù)據(jù)恰好是他們所需要的,分析師更傾向于創(chuàng)建并保存自己的數(shù)據(jù)集。
元數(shù)據(jù)——與存儲數(shù)據(jù)區(qū)塊相關(guān)聯(lián)的標(biāo)簽,可以在減少數(shù)據(jù)存儲過剩中起到作用。 基本屬性,比如數(shù)據(jù)創(chuàng)建日期,數(shù)據(jù)的所有者和使用數(shù)據(jù)的申請,都是潛在的元數(shù)據(jù)標(biāo)簽。屬性公式的描述,轉(zhuǎn)換描述可以在單獨(dú)的文檔內(nèi)記載;使用標(biāo)簽將其鏈接到更具體的文檔。
你可以在存儲戰(zhàn)略中包含元數(shù)據(jù)管理,促進(jìn)數(shù)據(jù)重用。這有助于降低整體存儲成本,或許更重要的是,它促進(jìn)了共享數(shù)據(jù)的使用。這也降低了在常用方案中,使用多個(gè)版本的公式和源數(shù)據(jù)的風(fēng)險(xiǎn)。
訪問控制和安全問題
精心設(shè)計(jì)的元數(shù)據(jù)可以促進(jìn)數(shù)據(jù)重用,但有時(shí)這不合適。例如,機(jī)密和隱私數(shù)據(jù),很顯然,需要一個(gè)限制訪問的政策。關(guān)系數(shù)據(jù)庫提供了控制數(shù)據(jù)訪問的大量工具, 包括細(xì)粒度,行級訪問控制。控制訪問的方法部分取決于數(shù)據(jù)存儲在云的方式。
當(dāng)數(shù)據(jù)存儲在云的關(guān)系數(shù)據(jù)庫中,你和本地?fù)碛邢嗤脑L問控制選項(xiàng)。當(dāng)你切換到一個(gè)不同模式的存儲時(shí),比如基于云的服務(wù),類似AWS DynamoDB或SimpleDB,你需要使用這些系統(tǒng)內(nèi)的可用訪問控制機(jī)制。
當(dāng)使用區(qū)塊存儲時(shí),你可能需要適應(yīng)粗粒度訪問控制,如在文件層允許或拒絕訪問。這些控制可能需要用特定方式復(fù)制或整理數(shù)據(jù),使只有合法需求的人才能訪問機(jī)密和隱私數(shù)據(jù)。
幫助管理云存儲的工具
在你制定云存儲戰(zhàn)略時(shí),評估可以協(xié)助整體管理的工具。云供應(yīng)商通常提供幫助監(jiān)測云存儲的工具,其中一些可以在超越存儲值時(shí),向你發(fā)送警報(bào)。在其他情況下,第三方工具,比如Cloudyn或CloudCheckr,可以用來收集和分析存儲數(shù)據(jù),幫助你更好地預(yù)測存儲趨勢和未來需求。
將存儲遷移到云,不會自動節(jié)省存儲成本。主動的管理和明確的政策和程序,才能幫助你最大化在任何云存儲部署上的投資回報(bào)。