隨著云計算和虛擬化技術的普及,數據中心基礎設施領域出現了很多技術創新。Amazon負責數據中心的副總裁James Hamilton曾經說過,在最近5年內數據中心領域技術創新超過了過去15年的創新之和,而這些創新基本上都是被云計算和超大規模互聯網應用所驅動。
Scale Up是傳統IT界應對大數據、大容量、大流量的解決方案,也就是造更大、更快、更強的IT設備,從而形成了“高性能服務器+高性能SAN存儲+高速以太網”這樣的“三高”IT架構模型。為了維護自己在業界的市場地位,各個計算、存儲和網絡廠商不停的推出高規格的旗艦產品來證明自己的存在。但是在新互聯網時代,我們看到傳統的Scale Up方案越來越力不從心,這不僅因為高性能設備的研發和制造成本越來越高,更因為傳統的通過高性能設備實現的Scale Up方案自身的技術極限,無法滿足大數據互聯網級的要求。為了應對這個挑戰, Scale Out解決方案應時出現。所謂Scale Out,簡單的講就是利用分布式和并行計算的原理,把原先由高性能設備完成的任務分布到一群設備上去完成,在滿足處理性能要求的同時保證相關的高可靠性,并降低相關成本。
Scale Out是天生屬于計算領域的。我們知道最早的高端企業級計算領域是大型機/小型機的世界。計算機的硬件、操作系統和跑在其上的應用是縱向整合的,當時IBM控制了整個業界的創新步伐。但是在新互聯網領域,面對terabyte級別甚至petabyte級別的數據集處理要求,Scale Out是唯一的選擇。基于商用x86架構工業標準服務器集群和分布式軟件來構建互聯網架構,是目前互聯網領域的技術熱點,典型代表之一是Apache Hadoop開源軟件項目。現在大型云計算互聯網公司數據中心動輒上萬臺Hadoop服務器來實現其并行計算。例如百度的Hadoop服務器規模是1萬多臺,已經超過了Yahoo和Facebook,2012年計劃將達到2萬臺。同時,面向企業級私有云的Hadoop實踐也開始走向實踐。
在IT基礎設施領域,除了計算以外,存儲領域也開始從Scale Up邁向Scale Out。一個主要的原因就是CPU的性能和密度持續超過旋轉磁盤的讀取性能。傳統的SAN和NAS外置存儲解決方案過去受歡迎的原因就是外部磁盤陣列可以通過多軸磁盤實現高速IO,以及可以實現方便的磁盤陣列擴充。只要應用不需要非常快的讀寫大量數據,這種把存儲外置在服務器之外,也就是存儲和計算分離的解決方案可以工作的很好。但是一旦面對大數據快速讀寫,傳統SAN/NAS技術架構就會出現技術瓶頸。考慮到這種情況,最近有人甚至預言未來外置高性能存儲將趨向滅亡,取而代之的是Scale Out解決方案。具體說就是返璞歸真——把數據推向計算點,而不是計算點通過一個fabric從遠端陣列獲取數據。這種模型通過分布式文件系統(如Hadoop文件系統,HDFS)構建在x86服務器集群上,有效的利用本地存儲的低成本和高速實現相對于外置集中存儲的性能、擴展和成本優勢。一旦這種模式得到普及,傳統的SAN/NAS的外置式存儲恐怕將像恐龍一樣淡出歷史舞臺。
看完計算和存儲,我們來看看IT基礎設施的最后一塊拼圖——網絡,是否也要走向“Scale Out”?答案是Yes。雖然單個網絡產品本身的性能和接口帶寬是不斷的向“UP”的方向發展的,例如在未來的數據中心,10GE接口將漸漸普及到接入層, 40GE/100GE接口也將在不遠的將來進入實用。但是就整個網絡架構來講,在計算和存儲向Scale Out架構發展的大前提下,網絡的Scale Out是必然的發展趨勢。這里面有三點含義:
拓撲結構的Scale Out
新型的互聯網將不再是傳統企業網的三層或者多層組網,而是扁平化的二層組網架構。因為扁平的二層組網架構將最大程度的減少節點和節點之間的跳數和時延,更加有利于Hadoop等分布式軟件發揮效能。扁平化組網要求網絡核心模塊有極強的彈性擴展能力,可以在節點數目增加時實現網絡接入模塊的按需掛接。
性能上的Scale Out
網絡作為新一代數據中心的fabric,不能成為性能瓶頸。但是當單端口的帶寬達到一定極限的時候,就必須實現大流量在整個數據中心范圍內的多個接入端口/上聯端口的橫向Scale Out。從本質上說,H3C的IRF2技術,以及針對數據中心大二層網絡需求的IETF TRILL標準,都是這種Scale Out解決方案。
網絡服務的Scale Out
所謂網絡服務是指安全和流量分析等4-7層的網絡增值業務。在傳統的數據中心網絡服務模塊,如防火墻是作為一個單獨的模塊掛接在核心層或者匯聚層上的,總體來講是一種集中式處理模式。隨著數據中心規模和流量的上升,這種部署要求防火墻性能越來越高,以至于會成為一個嚴重的業務瓶頸點。因此在大數據互聯網數據中心中網絡服務部署必須走Scale Out模式。簡單的講,就是在大二層組網下,網絡服務模塊必須貼近節點(物理的或者虛擬的),并通過分布式網絡軟件把大量、分散的網絡服務模塊虛擬化起來,統一管理部署和動態調配,來滿足業務處理需求。
總之,新的IT技術創新雖然目前都只是在互聯網大數據環境下在應用,傳統的技術也不會馬上消亡,但是我們可以想見到Scale Out模式對未來泛企業IT模型的影響,也就是說IT架構的價值從硬件轉向了軟件。不論您是企業IT人員、系統集成商、還是IT設備制造商,恐怕今天都要問一句自己:
今天,你“OUT”了嗎?