易有太極,是生兩儀,兩儀生四象,四象生八卦,世間萬物皆出于此。古人的《易經(jīng)》用這段話解釋萬物起源的過程,而我們是如何得知的呢?因?yàn)閿?shù)據(jù)的保存流傳,數(shù)據(jù)信息可以看做文明傳播的主要載體,而存儲(chǔ)介質(zhì)的使用則是數(shù)據(jù)信息傳播的主要工具。從結(jié)繩記事,到甲骨、青銅鼎,再到紙張的使用,人們通過不斷的改造發(fā)明,將文明傳播一代又一代,也改進(jìn)了人類發(fā)展進(jìn)程。這里有一個(gè)反例可以看出存儲(chǔ)介質(zhì)選用的重要性,作為四大文明古國(guó)之一的印度就曾出現(xiàn)了較為嚴(yán)重的文化斷層,據(jù)考古研究他們使用樹皮或樹葉記錄信息,到今天的存世量非常稀少,有學(xué)者指出這是導(dǎo)致文化斷層的最根本原因。
隨著工業(yè)革命的發(fā)生,科技的日新月異,人們選用的存儲(chǔ)介質(zhì)也發(fā)生了較大的變化,硬盤開始成為人們?nèi)粘I罟ぷ髦械谋貍淦罚⒃跀?shù)據(jù)存儲(chǔ)中扮演著重要角色。但是近年來,由于社交網(wǎng)站、智能移動(dòng)終端的不斷普及,人們創(chuàng)造出來的數(shù)據(jù)量是驚人的,據(jù)統(tǒng)計(jì)2013年光中國(guó)產(chǎn)生的數(shù)據(jù)總量就已經(jīng)超過0.8ZB(相當(dāng)于8億TB),在海量數(shù)據(jù)的壓力下,數(shù)據(jù)的存儲(chǔ)介質(zhì)會(huì)發(fā)生什么改變?企業(yè)面對(duì)海量數(shù)據(jù)如何改造升級(jí)傳統(tǒng)數(shù)據(jù)中心來滿足業(yè)務(wù)運(yùn)營(yíng)的需求?新興的互聯(lián)網(wǎng)巨頭公司又該如何解決自身龐大數(shù)據(jù)的存取難題?這些亟待解決的問題是用傳統(tǒng)手段,比如無限制擴(kuò)展數(shù)據(jù)中心規(guī)模,擴(kuò)充存儲(chǔ)容量,還是采用新的科技手段,選擇新的存儲(chǔ)介質(zhì)來滿足海量數(shù)據(jù)的存取需求呢?
大數(shù)據(jù)下的數(shù)據(jù)取舍
要想解決上面提到的問題,首先我們應(yīng)該先了解現(xiàn)階段下海量數(shù)據(jù)的構(gòu)成特點(diǎn)。以前的數(shù)據(jù)存儲(chǔ)基本是基于結(jié)構(gòu)化數(shù)據(jù)進(jìn)行的,這些數(shù)據(jù)有一定的規(guī)律性,通過簡(jiǎn)單的機(jī)制就可以方便的存儲(chǔ)數(shù)據(jù)并能夠隨時(shí)獲取到相關(guān)信息。但是隨著社交網(wǎng)絡(luò)以及智能設(shè)備的普及,任何一個(gè)人都能產(chǎn)生大量數(shù)據(jù),而這些數(shù)據(jù)又雜亂無章,毫無規(guī)律可循,這些數(shù)據(jù)又被被稱為非結(jié)構(gòu)化數(shù)據(jù)。尤其是互聯(lián)網(wǎng)行業(yè),用戶在其平臺(tái)上所創(chuàng)造的視頻、文字、圖片更是缺少一定的信息標(biāo)注,使得早期的數(shù)據(jù)中心很難區(qū)分?jǐn)?shù)據(jù)類型,對(duì)數(shù)據(jù)信息采取直接存儲(chǔ)的方式,極大降低了數(shù)據(jù)的可用性,并造成了一定的成本浪費(fèi)。
在大數(shù)據(jù)時(shí)代,人們開始重新審視數(shù)據(jù)的可用性以及重要性。由結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)組成的海量數(shù)據(jù)對(duì)于企業(yè)的IT建設(shè)成本負(fù)擔(dān)占據(jù)多大比例?這些數(shù)據(jù)的可用性對(duì)于企業(yè)來說是否能夠逐漸降低其投入產(chǎn)出比?如果要解決這些問題,首先要從存儲(chǔ)其數(shù)據(jù)的介質(zhì)開始說起。
傳統(tǒng)機(jī)械硬盤存儲(chǔ)的弊端
我們知道自從硬盤被IBM這藍(lán)色巨人造出來后就一直承擔(dān)著數(shù)據(jù)存儲(chǔ)的重?fù)?dān),在企業(yè)IT基礎(chǔ)架構(gòu)中,硬盤都是搭建IT整體架構(gòu)的“板磚”。硬盤廠商通過技術(shù)更迭、廠商之間的各種收購,現(xiàn)在已經(jīng)形成了寡頭時(shí)代,如買了IBM硬盤業(yè)務(wù)的日立環(huán)球存儲(chǔ)被西部數(shù)據(jù)收購,更名HGST,西部數(shù)據(jù)也因此坐擁硬盤老大地位;由IBM前員工創(chuàng)辦的希捷公司,在收購邁拓、三星的硬盤業(yè)務(wù)后,也穩(wěn)居硬盤市場(chǎng)第二,硬盤市場(chǎng)競(jìng)爭(zhēng)激烈程度可見一斑。因?yàn)橛脩舻母咝枨罅浚拍軇?chuàng)造市場(chǎng)的繁榮,份額大了,搶得人就會(huì)多,手段就會(huì)激烈。
那么這一對(duì)硬盤的高需求量在大數(shù)據(jù)、云計(jì)算時(shí)代下發(fā)生著哪些變化呢?因?yàn)閭鹘y(tǒng)機(jī)械硬盤單碟容量的限制,導(dǎo)致大多數(shù)用戶在面對(duì)海量數(shù)據(jù)時(shí)只能采取不斷擴(kuò)容的手段來滿足數(shù)據(jù)存取的需求。而不斷的擴(kuò)容必然導(dǎo)致設(shè)備能耗的增加以及空間資源的浪費(fèi),這也使企業(yè)陷入了一個(gè)“容量無底洞,金錢塞不夠”的狀況。另外,因?yàn)閭鹘y(tǒng)機(jī)械硬盤的轉(zhuǎn)速、性能方面以及高可靠性等方面的局限,令用戶在存取大容量數(shù)據(jù)時(shí),增加一定的時(shí)間成本。再加上現(xiàn)在占據(jù)主流的非結(jié)構(gòu)化數(shù)據(jù)的多樣性,讓用戶不再單單滿足于簡(jiǎn)單的數(shù)據(jù)存儲(chǔ),而是需要在成千上萬次的數(shù)據(jù)存取過程中去尋找數(shù)據(jù)價(jià)值,這對(duì)于一塊硬盤的性能有非常高的要求。
閃存的選擇
傳統(tǒng)機(jī)械硬盤無法滿足用戶的各種新需求,技術(shù)的發(fā)展又不能很快的跟隨著用戶需求的變化速度,那么大家就開始尋找其他類型的存儲(chǔ)介質(zhì),閃存就被提了出來。顧名思義,閃存就是存取速度方面非常占優(yōu)的存儲(chǔ)介質(zhì)。閃存的出現(xiàn)有一定時(shí)間了,但是人們總是對(duì)它報(bào)以不信任感,除了價(jià)格昂貴,還有傳統(tǒng)的認(rèn)知,小小芯片的存儲(chǔ)介質(zhì)實(shí)在難以讓傳統(tǒng)企業(yè)信任,還是大大的碟片看著讓人舒服省心啊。到目前為止,很多金融機(jī)構(gòu)仍然不敢將閃存作為高性能運(yùn)算方面的主要存儲(chǔ)介質(zhì),也是出于對(duì)其不穩(wěn)定性的擔(dān)憂。
但是在性能方面,閃存絕對(duì)可以解決現(xiàn)在大數(shù)據(jù)時(shí)代下的各種需求。對(duì)海量數(shù)據(jù)的存取速度,已經(jīng)超過傳統(tǒng)機(jī)械硬盤的幾十倍,小而精的體積又讓傳統(tǒng)數(shù)據(jù)中心節(jié)約大量空間,并能夠節(jié)省能耗,為數(shù)據(jù)中心省下一大筆錢。當(dāng)然了,“節(jié)省一大筆錢”的前提是這些閃存都是別人送你的。所以,現(xiàn)在閃存的應(yīng)用還是走不出貴與不穩(wěn)定的“高富帥”形象。兩大硬盤巨頭到現(xiàn)在也沒怎么發(fā)展固態(tài)硬盤業(yè)務(wù),可能也是說明了市場(chǎng)選擇的一個(gè)大致方向。