如今,現(xiàn)代企業(yè)的業(yè)務(wù)核心就是數(shù)據(jù)。雖然數(shù)據(jù)存儲(chǔ)一直在企業(yè)運(yùn)營(yíng)中發(fā)揮了不可或缺的作用,但在過去,人們卻很少考慮其成功的關(guān)鍵。這是因?yàn)槟菚r(shí)的數(shù)據(jù)還沒有被確認(rèn)為非常寶貴的財(cái)富,并強(qiáng)大到足以決定公司的命運(yùn),而如今則有所不同,得到人們的重視。
然而,我們目前正在對(duì)數(shù)字革命重新定義,企業(yè)和個(gè)人的自身行為方式也在相互發(fā)生作用。大數(shù)據(jù)集,海量信息和洞察力現(xiàn)在被認(rèn)為是箱子中的寶貝,可以給企業(yè)帶來競(jìng)爭(zhēng)優(yōu)勢(shì)。
魔鬼叉子
不可能實(shí)現(xiàn)的事情
到2020年,機(jī)器生成的數(shù)據(jù)量將是人類創(chuàng)造數(shù)據(jù)量的15倍。而常見的IT最佳實(shí)踐的實(shí)施、操作、管理和存儲(chǔ)的數(shù)據(jù)量已達(dá)到數(shù)百PB,而這些將成為不可持續(xù)的期望。
當(dāng)相關(guān)媒介不能保持與數(shù)據(jù)存儲(chǔ)增長(zhǎng)的步伐時(shí),你可能被一個(gè)“魔鬼叉子”終結(jié)了,所謂“魔鬼叉子”是一種視覺假象,這意味不可能制造出來的物體。或者是超出了所承受的極限。數(shù)據(jù)中心的數(shù)據(jù)更新和存儲(chǔ)需要更高的可擴(kuò)展性,以及存儲(chǔ)數(shù)據(jù)的恢復(fù),因此,所有權(quán)的總成本過高。那么,存儲(chǔ)技術(shù)的進(jìn)步如何促進(jìn)數(shù)據(jù)中心的發(fā)展?
鑒于企業(yè)的經(jīng)營(yíng)方式和數(shù)據(jù)量非常大的不可阻擋的創(chuàng)作方式的重大變化,令人驚訝的是,傳統(tǒng)的文件系統(tǒng),存儲(chǔ)區(qū)域網(wǎng)絡(luò)(SAN)、網(wǎng)絡(luò)附加存儲(chǔ)(NAS),統(tǒng)一存儲(chǔ)系統(tǒng)不足以滿足企業(yè)數(shù)據(jù)存儲(chǔ)需求。數(shù)據(jù)中心技術(shù)需要跟上數(shù)據(jù)增長(zhǎng)呈指數(shù)式增長(zhǎng)這個(gè)新的現(xiàn)實(shí)。那么解決的方案是什么嗎?對(duì)象存儲(chǔ)。但在人們致力于更快的技術(shù)發(fā)展之前,讓我們來看看數(shù)據(jù)存儲(chǔ)的景觀是什么樣子,人們直到幾年前才了解為什么對(duì)象存儲(chǔ)如此發(fā)展迅速,并變得如此流行。
傳統(tǒng)存儲(chǔ)技術(shù)有兩種變化。首先是塊存儲(chǔ),管理磁盤扇區(qū)和磁道內(nèi)的數(shù)據(jù)塊。其次是文件存儲(chǔ),管理文件組織成分層文件系統(tǒng)中的文件。塊存儲(chǔ)采用SAN的,其中是通過SCSI磁盤陣列,iSCSI或光纖通道網(wǎng)絡(luò)連接服務(wù)器,而文件存儲(chǔ)提供了標(biāo)準(zhǔn)的網(wǎng)絡(luò)文件共享協(xié)議來交換系統(tǒng)之間的文件內(nèi)容。
這些傳統(tǒng)的技術(shù)都具有消極的一面,但就整體而言,還是能夠滿足企業(yè)的數(shù)據(jù)存儲(chǔ)要求,直到需要應(yīng)對(duì)大規(guī)模數(shù)據(jù)的指數(shù)增長(zhǎng)。據(jù)調(diào)查機(jī)構(gòu)IDC的預(yù)測(cè),2015年到2019年,用于大數(shù)據(jù)部署存儲(chǔ)硬件的復(fù)合年均增長(zhǎng)率為29.9%,2019年的存儲(chǔ)總量將達(dá)到73.41EB。作為一個(gè)整體,存儲(chǔ)的硬件主軟件,以及大數(shù)據(jù)服務(wù)將以24.6%的復(fù)合年增長(zhǎng)率增長(zhǎng)。
輸入對(duì)象存儲(chǔ)
讓我們來看看什么是對(duì)象存儲(chǔ),以及它如何幫助那些處于萌芽的數(shù)字企業(yè)轉(zhuǎn)型為全球網(wǎng)絡(luò)巨頭的。雖然許多廠商都在開發(fā)PB級(jí)別的存儲(chǔ)技術(shù),但一些領(lǐng)先企業(yè),如亞馬遜,谷歌,F(xiàn)acebook,以及雅虎公司都在致力于研發(fā)一些創(chuàng)新技術(shù),解決如數(shù)據(jù)恢復(fù)能力,數(shù)據(jù)持久性,基礎(chǔ)設(shè)施,管理,電源,冷卻等運(yùn)營(yíng)總成本,以及海量存儲(chǔ)的增長(zhǎng)等面臨的挑戰(zhàn)。他們目前正在蓬勃開展這樣的項(xiàng)目。
對(duì)象存儲(chǔ)的這些早期采用者們很快就認(rèn)識(shí)到,數(shù)據(jù)中心的可擴(kuò)展性是一個(gè)難以克服的障礙,雖然它具有理論上沒有限制的優(yōu)勢(shì):而到目前為止,存儲(chǔ)的數(shù)據(jù)已經(jīng)達(dá)到或超過10艾字節(jié)。這個(gè)原因難以忽視除,對(duì)象存儲(chǔ)工作迅速地滲透到企業(yè)層面的主流應(yīng)用中。那么究竟它是否有助于克服PB級(jí)別的挑戰(zhàn)嗎?
對(duì)象存儲(chǔ)是基于無共享架構(gòu):一個(gè)分布式節(jié)點(diǎn)計(jì)算架構(gòu),其中沒有節(jié)點(diǎn)共享系統(tǒng)資源,其中包括CPU,存儲(chǔ)器,或物理存儲(chǔ)介質(zhì)。而沒有共享的架構(gòu),就沒有一個(gè)單點(diǎn)的失敗,也沒有系統(tǒng)的競(jìng)爭(zhēng)。可擴(kuò)展性在容量和性能上接近線性。而存儲(chǔ)硬件上,其中包括低成本服務(wù)器,硬盤,固態(tài)硬盤,網(wǎng)卡等。
對(duì)象存儲(chǔ)是軟件定義的存儲(chǔ)(SDS),因?yàn)樗鼘⒌统杀痉?wù)器的硬件轉(zhuǎn)換成高度可擴(kuò)展的,彈性存儲(chǔ)系統(tǒng)。事實(shí)上,一些對(duì)象存儲(chǔ)軟件使用擦除編碼技術(shù),可以允許成本更低的桌面硬盤在不損失性能和可伸縮性的情況下,實(shí)現(xiàn)更低的平均時(shí)間故障,以及更低誤碼率。
四種不同的對(duì)象存儲(chǔ)選項(xiàng)可供選擇:兩個(gè)是商業(yè)化的,兩個(gè)是開放源碼的。在一般情況下,這四個(gè)對(duì)象存儲(chǔ)選項(xiàng)都沒有共享架構(gòu)。它們的特點(diǎn)是:
·完全分布沒有單點(diǎn)故障
·可擴(kuò)展到PB級(jí)別
·自動(dòng)修復(fù)
·在大多數(shù)情況下,很少有管理員干預(yù),可以自我管理
·在服務(wù)器硬件上運(yùn)行嵌入式存儲(chǔ)媒體
對(duì)象存儲(chǔ)被設(shè)計(jì)成可大規(guī)模擴(kuò)展的,因此,與傳統(tǒng)的塊存儲(chǔ)或文件存儲(chǔ)系統(tǒng)有著根本的不同:它將信息轉(zhuǎn)換成彈性大小的容器,這稱之為對(duì)象。每個(gè)對(duì)象包括數(shù)據(jù)本身以及其相關(guān)聯(lián)的元數(shù)據(jù),并具有一個(gè)全局唯一標(biāo)識(shí)符,而不是一個(gè)文件名和文件路徑。這些唯一標(biāo)識(shí)符被部署在平面地址空間,從而消除了基于復(fù)雜文件路徑的分層文件系統(tǒng)的復(fù)雜性和可擴(kuò)展性的挑戰(zhàn)。
在當(dāng)前這樣的數(shù)據(jù)饑餓的環(huán)境中,我們生活的每一個(gè)方面是都是由數(shù)據(jù)驅(qū)動(dòng)的。所有數(shù)據(jù)的過去,現(xiàn)在和未來的業(yè)務(wù),都是有識(shí)之士眼中的潛在的金礦,傳統(tǒng)的規(guī)模有限的存儲(chǔ)模式注定不再適應(yīng)。相反,對(duì)象存儲(chǔ)才是最適合的技術(shù),可以提供超大規(guī)模和性能,使IT專業(yè)人員能夠分析和存儲(chǔ)如今盛行的龐大的非結(jié)構(gòu)化數(shù)據(jù)。