在客戶群中主要有兩類大數(shù)據(jù):數(shù)據(jù)挖掘和大規(guī)模NoSQL的大數(shù)據(jù)庫應(yīng)用。
利用大數(shù)據(jù)實現(xiàn)數(shù)據(jù)挖掘,需要隨著數(shù)據(jù)的增長找到相關(guān)的信息和模式,這將有助于更深刻洞察外部環(huán)境做出更好的業(yè)務(wù)決策。這些工作負載也有可能會發(fā)生規(guī)模、范圍上的變化,尤其是在剛開始的時候。
這些工作負載通常要求強大的后端處理能力用來分析大數(shù)據(jù)。為了有效地提煉這種類型的數(shù)據(jù),實施數(shù)據(jù)挖掘的基礎(chǔ)設(shè)施需要包含:
動態(tài)變化、靈活使用——大多數(shù)大數(shù)據(jù)工作都采用分批處理,要求有靈活的基礎(chǔ)設(shè)施來處理不可預(yù)測的工作負載;
滿足海量計算需求——“大”數(shù)據(jù)需要在一個較為合理的時間,通過工作負載提交一份有效的分析處理結(jié)果。
私有云和裸機系統(tǒng)各有利弊
那什么樣的基礎(chǔ)設(shè)施選擇可以滿足這些要求呢?雖然多租戶虛擬云平臺也提供了一個巨大的經(jīng)濟模型,并能處理可變的工作負載,但對性能的高要求會使得管理變得更為復(fù)雜。
虛擬化、共享和超額認購的多租戶云容易給用戶帶來糾紛。大數(shù)據(jù)可能會影響到同一個共享的虛擬化環(huán)境中的每個人,包括大數(shù)據(jù)工作本身。另一個方法就是建立專有的基礎(chǔ)設(shè)施來避免或者減輕這些問題。
多租戶共享IaaS基礎(chǔ)設(shè)施
但這樣一來會使得你面臨兩難境地:要么繼續(xù)選擇表現(xiàn)欠佳的虛擬云平臺并支付報酬,要么白手起家搭建自己的基礎(chǔ)設(shè)施。你如何既獲得靈活性又獲得大數(shù)據(jù)業(yè)務(wù)處理需要的高性能?
裸機云可以提供專用的存儲和計算,以及不可預(yù)知的工作負載所需的靈活性。在裸機云平臺,所有的計算和直連存儲與工作負載是直接相關(guān)的。這些設(shè)備不會產(chǎn)生租戶之間的糾紛,不會影響需求的滿足。最值的稱道的是,可以根據(jù)自己的使用情況來支付相應(yīng)的成本,不會存在浪費。
另外還需要注意的是,即使是專用服務(wù)器和存儲設(shè)備,它們所采用的網(wǎng)絡(luò)層仍然在多個租戶之間共享,這可能是一些大型Hadoop工作負載所面臨的線速性能的瓶頸點之一。即便裸機擁有最優(yōu)惠的價格性能比,但它也無法消除這種限制。
主機托管云或私有云是一個更好的選擇,在某些情況下,私人網(wǎng)絡(luò)基礎(chǔ)設(shè)施可以進行定制,以滿足您的特定需求。它們可以根據(jù)業(yè)務(wù)情況提供線性網(wǎng)絡(luò)性能以及專用的計算、存儲擴展,并保持合理的靈活性。當然,這不會是最經(jīng)濟的選擇,但如果你的工作量需求要求這一點,還是值得選擇。
當然,無論你是借助虛擬云或者裸機來推進大數(shù)據(jù),你都需要理解一點,基礎(chǔ)設(shè)施會隨著需求和時間的推移而改變。往往一開始的時候,一個虛擬云平臺或者裸機系統(tǒng)就能滿足要求,而且裸機系統(tǒng)有時候還能提供更好的性能和擴展性。但由于大數(shù)據(jù)業(yè)務(wù)的需要,設(shè)立一個完全自主可用的私有云可能會更符合自己的要求,畢竟它不存在網(wǎng)絡(luò)共享帶來的局限性。