隨著工業(yè)革命的發(fā)生,科技的日新月異,人們選用的存儲介質(zhì)也發(fā)生了較大的變化,硬盤開始成為人們?nèi)粘I罟ぷ髦械谋貍淦罚⒃跀?shù)據(jù)存儲中扮演著重要角色。但是近年來,由于社交網(wǎng)站、智能移動終端的不斷普及,人們創(chuàng)造出來的數(shù)據(jù)量是驚人的,據(jù)統(tǒng)計2013年光中國產(chǎn)生的數(shù)據(jù)總量就已經(jīng)超過0.8zb(相當于8億tb),在海量數(shù)據(jù)的壓力下,數(shù)據(jù)的存儲介質(zhì)會發(fā)生什么改變?企業(yè)面對海量數(shù)據(jù)如何改造升級傳統(tǒng)數(shù)據(jù)中心來滿足業(yè)務(wù)運營的需求?新興的互聯(lián)網(wǎng)巨頭公司又該如何解決自身龐大數(shù)據(jù)的存取難題?這些亟待解決的問題是用傳統(tǒng)手段,比如無限制擴展數(shù)據(jù)中心規(guī)模,擴充存儲容量,還是采用新的科技手段,選擇新的存儲介質(zhì)來滿足海量數(shù)據(jù)的存取需求呢?
大數(shù)據(jù)下的數(shù)據(jù)取舍
要想解決上面提到的問題,首先我們應(yīng)該先了解現(xiàn)階段下海量數(shù)據(jù)的構(gòu)成特點。以前的數(shù)據(jù)存儲基本是基于結(jié)構(gòu)化數(shù)據(jù)進行的,這些數(shù)據(jù)有一定的規(guī)律性,通過簡單的機制就可以方便的存儲數(shù)據(jù)并能夠隨時獲取到相關(guān)信息。但是隨著社交網(wǎng)絡(luò)以及智能設(shè)備的普及,任何一個人都能產(chǎn)生大量數(shù)據(jù),而這些數(shù)據(jù)又雜亂無章,毫無規(guī)律可循,這些數(shù)據(jù)又被被稱為非結(jié)構(gòu)化數(shù)據(jù)。尤其是互聯(lián)網(wǎng)行業(yè),用戶在其平臺上所創(chuàng)造的視頻、文字、圖片更是缺少一定的信息標注,使得早期的數(shù)據(jù)中心很難區(qū)分數(shù)據(jù)類型,對數(shù)據(jù)信息采取直接存儲的方式,極大降低了數(shù)據(jù)的可用性,并造成了一定的成本浪費。
在大數(shù)據(jù)時代,人們開始重新審視數(shù)據(jù)的可用性以及重要性。由結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)組成的海量數(shù)據(jù)對于企業(yè)的it建設(shè)成本負擔占據(jù)多大比例?這些數(shù)據(jù)的可用性對于企業(yè)來說是否能夠逐漸降低其投入產(chǎn)出比?如果要解決這些問題,首先要從存儲其數(shù)據(jù)的介質(zhì)開始說起。
傳統(tǒng)機械硬盤存儲的弊端
我們知道自從硬盤被ibm這藍色巨人造出來后就一直承擔著數(shù)據(jù)存儲的重擔,在企業(yè)it基礎(chǔ)架構(gòu)中,硬盤都是搭建it整體架構(gòu)的“板磚”。硬盤廠商通過技術(shù)更迭、廠商之間的各種收購,現(xiàn)在已經(jīng)形成了寡頭時代,如買了ibm硬盤業(yè)務(wù)的日立環(huán)球存儲被西部數(shù)據(jù)收購,更名hgst,西部數(shù)據(jù)也因此坐擁硬盤老大地位;由ibm前員工創(chuàng)辦的希捷公司,在收購邁拓、三星的硬盤業(yè)務(wù)后,也穩(wěn)居硬盤市場第二,硬盤市場競爭激烈程度可見一斑。因為用戶的高需求量,才能創(chuàng)造市場的繁榮,份額大了,搶得人就會多,手段就會激烈。
那么這一對硬盤的高需求量在大數(shù)據(jù)、云計算時代下發(fā)生著哪些變化呢?因為傳統(tǒng)機械硬盤單碟容量的限制,導(dǎo)致大多數(shù)用戶在面對海量數(shù)據(jù)時只能采取不斷擴容的手段來滿足數(shù)據(jù)存取的需求。而不斷的擴容必然導(dǎo)致設(shè)備能耗的增加以及空間資源的浪費,這也使企業(yè)陷入了一個“容量無底洞,金錢塞不夠”的狀況。另外,因為傳統(tǒng)機械硬盤的轉(zhuǎn)速、性能方面以及高可靠性等方面的局限,令用戶在存取大容量數(shù)據(jù)時,增加一定的時間成本。再加上現(xiàn)在占據(jù)主流的非結(jié)構(gòu)化數(shù)據(jù)的多樣性,讓用戶不再單單滿足于簡單的數(shù)據(jù)存儲,而是需要在成千上萬次的數(shù)據(jù)存取過程中去尋找數(shù)據(jù)價值,這對于一塊硬盤的性能有非常高的要求。
閃存的選擇
傳統(tǒng)機械硬盤無法滿足用戶的各種新需求,技術(shù)的發(fā)展又不能很快的跟隨著用戶需求的變化速度,那么大家就開始尋找其他類型的存儲介質(zhì),閃存就被提了出來。顧名思義,閃存就是存取速度方面非常占優(yōu)的存儲介質(zhì)。閃存的出現(xiàn)有一定時間了,但是人們總是對它報以不信任感,除了價格昂貴,還有傳統(tǒng)的認知,小小芯片的存儲介質(zhì)實在難以讓傳統(tǒng)企業(yè)信任,還是大大的碟片看著讓人舒服省心啊。到目前為止,很多金融機構(gòu)仍然不敢將閃存作為高性能運算方面的主要存儲介質(zhì),也是出于對其不穩(wěn)定性的擔憂。
但是在性能方面,閃存絕對可以解決現(xiàn)在大數(shù)據(jù)時代下的各種需求。對海量數(shù)據(jù)的存取速度,已經(jīng)超過傳統(tǒng)機械硬盤的幾十倍,小而精的體積又讓傳統(tǒng)數(shù)據(jù)中心節(jié)約大量空間,并能夠節(jié)省能耗,為數(shù)據(jù)中心省下一大筆錢。當然了,“節(jié)省一大筆錢”的前提是這些閃存都是別人送你的。所以,現(xiàn)在閃存的應(yīng)用還是走不出貴與不穩(wěn)定的“高富帥”形象。兩大硬盤巨頭到現(xiàn)在也沒怎么發(fā)展固態(tài)硬盤業(yè)務(wù),可能也是說明了市場選擇的一個大致方向。