摘要:云服務(wù)和大數(shù)據(jù)分析需求的快速增長推動了新的存儲體系架構(gòu)的發(fā)展,以便企業(yè)能夠保存這些增長趨勢所產(chǎn)生的信息。很顯然,即使是線性增長的軌跡,其存儲也不足以提供物聯(lián)網(wǎng)所產(chǎn)生得海量數(shù)據(jù)的所需。當前的架構(gòu)存在的瓶頸不僅僅是不方便傳統(tǒng)遺留數(shù)據(jù)的存儲,同時也無法滿足當前規(guī)?;鎯Φ男枨?。
考慮到這種前所未有的海量存儲需求增長的預(yù)期,大型企業(yè)正在開始部署網(wǎng)絡(luò)規(guī)模的架構(gòu):從而能夠?qū)崿F(xiàn)大規(guī)模的虛擬化、計算和存儲功能。
增加存儲的靈活性
網(wǎng)絡(luò)規(guī)模的存儲設(shè)計的一個基本特征是消除存儲架構(gòu)的瓶頸。一個單一入口點可能成為一個單點故障點,尤其是在云計算的存儲需求方面。添加冗余的、昂貴的、高性能的組件,以改善這些瓶頸問題,是目前大多數(shù)服務(wù)提供商正在努力的方向,但這會非常迅速地增加成本和系統(tǒng)的復(fù)雜性。另一方面,一個橫向擴展的網(wǎng)絡(luò)規(guī)模系統(tǒng)設(shè)計能夠使得在更便宜的、低能耗的硬件的所有節(jié)點之間分配數(shù)據(jù)。
因為云供應(yīng)商要比企業(yè)用戶管理更多的用戶、具有更高的性能要求,因此,其解決諸如數(shù)據(jù)瓶頸這樣的性能問題的意義是相當重大的。雖然大多數(shù)企業(yè)用戶的系統(tǒng)均要求很高的性能,但這些系統(tǒng)通常僅僅只有較少的用戶,而這些用戶可以通過本地網(wǎng)絡(luò)直接訪問他們的文件。此外,通常企業(yè)系統(tǒng)用戶在訪問時,會發(fā)送和保存相對低容量的文件,如文件和電子表格等,他們所使用的存儲容量較少、也就降低了性能負載。
而那些在企業(yè)環(huán)境之外使用云計算的用戶會面臨非常不同的情景。該系統(tǒng)正在同時被相當數(shù)量級的用戶通過互聯(lián)網(wǎng)訪問,這無疑將互聯(lián)網(wǎng)本身變成了一個性能瓶頸。云提供商的存儲系統(tǒng)不僅必須擴展到每一位新增的用戶,同時還必須跨所有用戶確保總體性能。顯然,平均來說,云用戶的訪問次數(shù)要比一般的企業(yè)用戶更為頻繁,而且他們會存儲比企業(yè)用戶大得多的文件、音樂、照片和視頻。網(wǎng)絡(luò)規(guī)模架構(gòu)的設(shè)計則能夠防止由這種傳統(tǒng)的舊式存儲設(shè)置所導(dǎo)致的瓶頸問題。
不受硬件約束
網(wǎng)絡(luò)規(guī)模體系架構(gòu)的一個重要的區(qū)別是:其完全不依賴于硬件設(shè)備。由于硬件故障是不可避免的,而傳統(tǒng)的設(shè)備——存儲硬件通常內(nèi)置專有軟件——包括多個昂貴的副本組件,以預(yù)測和預(yù)防故障。這些額外的硬件提取層在能源消耗方面會使用更高的成本,同時也增加了單一設(shè)備層的復(fù)雜性。因為較之商品化的服務(wù)器,每臺設(shè)備的實際成本是相當高的。當企業(yè)開始研究如何擴展他們的數(shù)據(jù)中心時,成本費用估算往往就開始扶搖直上。避免這個問題的一種方法是通過使用軟件定義的vNAS或在一個管理程序環(huán)境使用vSAN;二者均能夠提供以網(wǎng)絡(luò)規(guī)模速率構(gòu)建服務(wù)器的方法。
分布式模型
與當前的集中式數(shù)據(jù)中心趨勢不同,構(gòu)建網(wǎng)絡(luò)規(guī)模存儲的最好方法是用一個分布式模型。這是因為現(xiàn)在有諸多的方法能夠在軟件層提高性能,以中和集中式數(shù)據(jù)存儲方法的性能優(yōu)勢。
由于用戶是從世界各地不同地理位置訪問云計算服務(wù),服務(wù)提供商需要提供遍布世界各地的數(shù)據(jù)中心服務(wù),以盡量減少加載時間。不過,確保全球同步的訪問體驗也會涉及到一些挑戰(zhàn)。工作負載在企業(yè)所在地理區(qū)域的數(shù)據(jù)中心是活躍狀態(tài)。這種情況造成了一個問題,因為存儲在所有地點的所有數(shù)據(jù)都必須同步。從視圖的架構(gòu)來看,在存儲層,而不是向上到應(yīng)用程序?qū)咏鉀Q這些問題是相當重要的,否則其會變得更加困難和復(fù)雜。
此外,管理全球的可用數(shù)據(jù)意味著在發(fā)生本地災(zāi)難事件的情況下,數(shù)據(jù)中心必須是彈性的。如停電事故,這會使本地服務(wù)器場脫機離線。如果一個地方的數(shù)據(jù)中心或服務(wù)器出現(xiàn)故障,全球數(shù)據(jù)中心必須迅速將數(shù)據(jù)傳輸?shù)娇捎玫姆?wù)器,以減少停機時間。雖然當然固然有很多解決這些問題的方法,但這些方法都是在應(yīng)用程序?qū)?。試圖在數(shù)據(jù)中心的基礎(chǔ)設(shè)施的層次結(jié)構(gòu)解決這些問題,而不是在存儲層解決,會帶來顯著的高成本和復(fù)雜性等缺點。直接在存儲層通過網(wǎng)絡(luò)規(guī)模架構(gòu)解決這些問題,則提供了顯著的效率,時間和成本節(jié)約等方面的好處。
建設(shè)未來
大數(shù)據(jù)分析和移動化的到來無疑是預(yù)示著廉價的存儲需求會不斷增加的兩大趨勢。如果企業(yè)繼續(xù)在他們的數(shù)據(jù)中心依靠昂貴的、呆板的設(shè)備,他們將被迫付出大額支出,發(fā)展足夠的存儲容量,以滿足客戶的需求。
隨著市場需求的變化,網(wǎng)絡(luò)環(huán)境、企業(yè)的重點優(yōu)先事項和預(yù)算也應(yīng)隨之進行相應(yīng)的調(diào)整。一個廣闊的、剛性的網(wǎng)絡(luò)環(huán)境鎖定外部供應(yīng)商的配置會嚴重限制該企業(yè)靈活應(yīng)對市場的需求,更談不上積極根據(jù)預(yù)期調(diào)整能力了。網(wǎng)絡(luò)規(guī)模的存儲理念使各大企業(yè)得以建立“面向未來”的數(shù)據(jù)中心。由于硬件和軟件的投資是彼此分開的,二者均可以調(diào)整到更好的,更合適的選擇方案,以最低的成本滿足市場需求。
存儲的未來
較新的數(shù)據(jù)存儲技術(shù),如超融合基礎(chǔ)設(shè)施和軟件定義的存儲預(yù)示了未來的需求:網(wǎng)絡(luò)規(guī)模的架構(gòu)。他們將允許企業(yè)能夠規(guī)?;潺嫶蟮挠嬎悱h(huán)境,與虛擬化組件集成整合。網(wǎng)絡(luò)規(guī)?;拇鎯υO(shè)計,消除了硬件造成的瓶頸,提高了敏捷性和速度,也有利于全球數(shù)據(jù)的可用性,并提供更大的效率,帶來了時間和成本的節(jié)約。考慮到數(shù)據(jù)的快速擴散和隨之而來的存儲需求的增加,網(wǎng)絡(luò)規(guī)模的存儲設(shè)計是合乎邏輯的選擇。
關(guān)于作者
本文作者Stefan Bernbo是Compuverde公司的創(chuàng)始人兼首席執(zhí)行官。20年來,Stefan設(shè)計和建造了眾多符合成本效益的企業(yè)級數(shù)據(jù)存儲解決方案,用于存儲龐大的數(shù)據(jù)集。從2004年到2010年,他曾在這一領(lǐng)域供職于Storegate公司,Storegate公司是一家面向普通消費者和企業(yè)市場的互聯(lián)網(wǎng)的存儲解決方案供應(yīng)商,滿足客戶最高的可用性和可擴展性的要求。此前,Stefan曾參與過全球領(lǐng)先的電信設(shè)備和服務(wù)、移動和固定網(wǎng)絡(luò)運營商,瑞典巨頭愛立信的系統(tǒng)和軟件的架構(gòu)的多個項目。