數據的快速增長導致用戶對計算機計算能力的需求越來越高。云計算在提高普通計算機快速處理能力上起到了很大的作用。云計算能夠對普通用戶使用計算機的模式進行改變,從而給用戶提供按需分配的存儲能力、計算能力以及應用服務能力等,給用戶帶來更多的方便,也在很大程度上降低了用戶對軟件和硬件采購的費用。但是,云計算需要各種技術手段作為支持,其中包括虛擬化技術、分布式的儲存方式、計算數據的管理以及數據同步運算等等。
1.云計算技術
云計算是一種基于網絡的新的計算方式。云計算的核心思想可以追溯到上世紀60年代。利用云計算和計算機的共享軟件和硬件資源能夠滿足對不同計算機和其他設備提供信息的需求。云計算是分布式處理、網絡計算和并行處理的發展,被譽為計算機科學概念的商業實現。云計算可以包括以下幾個層次的服務:基礎設施即服務、平臺即服務和軟件即服務。
由于云計算基于的都是一些成熟的技術,很快得到了IT業界眾多大廠商的大力推廣和支持,在近些年來呈現很好的發展趨勢,從而也凸顯出云計算的許多特征。首先,云計算具有很高的性價比,其利用非常好的容錯處理涉及,使得現有的貴重的專用服務器被廉價的個人電腦代替,并且在計算能力上有很大的提高。這樣既減少了硬件投入的成本,同時軟件維護和數據管理成本也得到有效的降低。其次,云計算具有動態可擴展性,因為云具有可以靈活進行動態擴張或收縮的規模,服務器能夠在任何時刻增加或移除服務器集群中。再次,云計算具有虛擬化的特點。云計算對于軟件和硬件資源實行虛擬化管理,用戶能夠不限時間,不限地點的訪問云上的服務和數據,甚至是輕易的完成超級計算任務。最后,靈活定制也是云計算的一個重要特征。因為云是一個非常巨大的資源站,為用戶能夠提供極大的計算能力和存儲能力,用戶可以根據自身需要選擇相應的數據資源和服務資源。
2.云數據管理技術
2.1 Dynamo技術
Dynamo技術能夠在不暴露于外網的前提下直接提供底層支持和AWS,因為它不僅具有存儲系統的分布式、數據庫和高可用行,還具有轉悠存儲系統的鍵值結構、Hash表分布式。Dynamo的基本儲存架構和理念是DHT,其最大的特點就是能夠均勻的存儲數據,各存儲點之間有相互感應的能力,因此它的自我管理性能特別強,不需要Mater主控點的控制,同時單點故障的危險也比較低。亞馬遜平臺的基礎存儲架構就是Dynamo技術,并且應用于亞馬遜的很多系統當中。Dynamo技術利用的是DHT的數據儲存方式,因此沒有熱點,這樣,各點的數據存儲量和訪問壓力就呈現出負載均衡的優勢。
2.2 MapReduce技術
MapReduce技術是谷歌設計的一種編程模式,適合應用在大規模數據集的并行處理當中,一般要求大于1TB云計算MapReduce的編程模式能夠有效的利用云計算的資源。MapReduce是一種新型的編程模式,能夠將所有針對海量異構數據的操作抽象為mah(映射)和reduce化簡廁種操作。Map能夠按照是否能夠在單個節點上完成運算的標準將任務分解成若干個自任務,再分配給不同的計算機進行處理。然后Reduce再按照軟件的程序設定對Map作用的結果集進行合成處理,得到最后的分析處理結論。除此之外,MapReduce向各節點分配map和reduce任務時,會考慮數據的本地性,將相應安排到參與數據的存放節點或附近節點去執行。
2.3 GFS技術
GFS是一個可擴展的分布式文件系統,用于大型的、分布式的、對大量數據進行訪問的應用。GFS整個系統的節點分為客戶端、主服務器和數據塊服務器三個角色。客戶端是GFS提供給應用程序的訪問接口,是一組不遵守POVSIX規范的專用接口,以庫文件的形式提供。GFS的管理節點是主服務器,在邏輯上僅存在一個,是GFS文件系統中的大腦,負責整個文件系統的管理。數據塊服務器中是以文件的形式存儲的數據,其個數可以有許多個,直接決定了GFS的規模。GFS數據以默認64MB的固定數據塊為單位進行存儲,并且分布在不同的數據塊服務上。
2.4 BigTable技術
BigTable技術是谷歌建立在GFS和MahReduce之上的一個大型分布式數據庫,其形式實際是一個龐大的表,其規模超過1PB,能夠將所有數據作為處理對象,從而形成一個巨大的表格。同時,BigTable還是一種擁有數據擴展功能所設計的管理結構化分布式數據存儲系統,從而達到巨大的規模。在BigTable技術進行數據處理工作時,能夠在每時每刻將表劃分到單獨的服務器中,并且充分運用主服務器誰是監測子表的負荷。
3.結束語
可以說,因計算技術以及云數據管理技術作為一種非常有現實意義的技術,使IT產業的運行方式有了徹底性的變化。隨著云計算技術和虛擬化的進一步發展,云計算技術必將會在更多的領域中得到更加廣泛的應用。同時,也會出現一些新的問題,這就要求相關學者加強研究技能,在數據中不斷的提供有用信息。在以后,云數據管理技術將會在提高存儲量、提高計算速度以及數據安全方面獲得更多的進步,然而,如何利用云計算并使之逐漸走向正規化、商業化和大眾化,還需要一個非常漫長的過程。