精品国产一级在线观看,国产成人综合久久精品亚洲,免费一级欧美大片在线观看

基于Hadoop平臺的云存儲應用實踐

責任編輯:vivian

2012-03-30 09:18:52

摘自:存儲在線

云存儲中心是由大量服務器構成Hadoop的數據節點((DataNodes),負責保存文件的內容,實現文件的分布式存儲、負載平衡以及文件的容錯控制。

云計算(Cloud Computing)是一種基于因特網的超級計算模式,在遠程的數據中心里,成千上萬臺電腦和服務器連接成一片電腦云。用戶通過電腦、筆記本、手機等方式接人數據中心,按自己的需求進行運算。目前,對于云計算仍沒有普遍一致的定義。結合上述定義,可以總結出云計算的一些本質特征,即分布式計算和存儲特性、高擴展性、用戶友好性、良好的管理性。

1云存儲架構圖

橘色的作為存儲節點(Storage Node)負責存放文件,藍色作為控制節點((Control Node)則是負責文件索引,并負責監控存儲節點間容量及負載的均衡,這兩個部分合起來便組成一個云存儲。存儲節點與控制節點都是單純的服務器,只是存儲節點的硬盤多一些,存儲節點服務器不需要具備RAID的功能,只要能安裝Linux即可,控制節點為了保護數據,需要有簡單的RAID level O1的功能。

云存儲不是要取代現有的盤陣,而是為了應付高速成長的數據量與帶寬而產生的新形態存儲系統,因此云存儲在設計時通常會考慮以下三點:

(1)容量、帶寬的擴容是否簡便

擴容是不能停機,會自動將新的存儲節點容量納入原來的存儲池。不需要做繁復的設定。

 

圖1云存儲架構圖

 (2)帶寬是否線形增長

使用云存儲的客戶,很多是考慮未來帶寬的增長,因此云存儲產品設計的好壞會產生很大的差異,有些十幾個節點便達到飽和,這樣對未來帶寬的擴容就有不利的影響,這一點要事先弄清楚,否則等到發現不符合需求時,已經買了幾百TB,后悔就來不及了。

(3)管理是否容易。

2云存儲關鍵技術

云存儲必須具備九大要素:①性能;②安全性;③自動ILM存儲;④存儲訪問模式;⑤可用性;⑥主數據保護;⑦次級數據保護;⑧存儲的靈活;⑨存儲報表。

云計算的發展離不開虛擬化、并行計算、分布式計算等核心技術的發展成熟。下面對其介紹如下:

(1)集群技術、網格技術和分布式文件系統

云存儲系統是一個多存儲設備、多應用、多服務協同工作的集合體,任何一個單點的存儲系統都不是云存儲。

既然是由多個存儲設備構成的,不同存儲設備之間就需要通過集群技術、分布式文件系統和網格計算等技術,實現多個存儲設備之間的協同工作,使多個的存 儲設備可以對外提供同一種服務,并提供更大更強更好的數據訪問性能。如果沒有這些技術的存在,云存儲就不可能真正實現,所謂的云存儲只能是一個一個的獨立 系統,不能形成云狀結構。

(2)CDN內容分發、P2P技術、數據壓縮技術、重復數據刪除技術、數據加密技術

CDN內容分發系統、數據加密技術保證云存儲中的數據不會被未授權的用戶所訪問,同時,通過各種數據備份和容災技術保證云存儲中的數據不會丟失,保證云存儲自身的安全和穩定。如果云存儲中的數據安全得不到保證,也沒有人敢用云存儲了。

(3)存儲虛擬化技術、存儲網絡化管理技術

云存儲中的存儲設備數量龐大且分布多在不同地域,如何實現不同廠商、不同型號甚至于不同類型(例如FC存儲和IP存儲)的多臺設備之間的邏輯卷管 理、存儲虛擬化管理和多鏈路冗余管理將會是一個巨大的難題,這個問題得不到解決,存儲設備就會是整個云存儲系統的性能瓶頸,結構上也無法形成一個整體,而 且還會帶來后期容量和性能擴展難等問題。

3部署Hadoop

從歷史上看,數據分析軟件面對當今的海量數據已顯得力不從心,這種局面正在悄然轉變。新的海量數據分析引擎已經出現。例如Apache的Hadoop,實踐證明,Hadoop在數據處理方面是做得最好的且是開源的平臺之一。

云存儲中心是由大量服務器構成Hadoop的數據節點((DataNodes),負責保存文件的內容,實現文件的分布式存儲、負載平衡以及文件的容錯控制。

下面將利用Hadoop作為實驗平臺,一步一步演示如何部署一個三個節點的集群,并測試一下MapRe-dace分布式處理的強大功能,在Hadoop分布式文件系統(HDFS)中存人兩個文件,并采用MapReduce計算出兩個namelist文件中各個名字出現的次數,程序架構設計如圖2所示。

 

圖2 3個節點的Hadoop集群

 其中NameNode主節點和DataNode從節點的分布情況如下:

表1

(1)啟動Hadoop集群

只需要在NameNode主節點上執行start-all.sh命令即可,同時Master節點可以通過ssh登錄到各,lave節點去啟動其他相關進程。

(2) MapRudce測試

在NameNode和DataNode兩個結點都運行正常的時候,也就是Hadoop部署成功了之后,我們在NameNode主節點上準備兩個名單文件。名單文件的內容如下:

4運行實驗及結果

5結語

結果跟我們預期的一樣,這樣在以Hadoop為平臺進行了對HDFS的文件存儲,并且統計了文件中數據的數量,然后顯示出來。

鏈接已復制,快去分享吧

企業網版權所有?2010-2024 京ICP備09108050號-6京公網安備 11010502049343號

  • <menuitem id="jw4sk"></menuitem>

    1. <form id="jw4sk"><tbody id="jw4sk"><dfn id="jw4sk"></dfn></tbody></form>
      主站蜘蛛池模板: 微山县| 彰武县| 邻水| 简阳市| 盘山县| 九寨沟县| 普宁市| 浦北县| 莱西市| 镇江市| 龙胜| 邻水| 肥东县| 美姑县| 铁岭县| 定结县| 饶阳县| 赤壁市| 蓝田县| 鄂托克前旗| 灵山县| 余庆县| 墨脱县| 阿合奇县| 开化县| 胶南市| 广饶县| 白山市| 宁河县| 中卫市| 祁阳县| 福清市| 柞水县| 武平县| 农安县| 唐河县| 隆昌县| 双柏县| 大化| 土默特左旗| 郴州市|