摘要:下一代數據中心(NGDC)設計包含一個統一的方法,在數據中心框架的每一層應用5個架構原則。這種方法影響軟件、過程和支持整個交付棧的人員。
下一代數據中心成功的的五項原則
下一代數據中心(NGDC)設計包含一個統一的方法,在數據中心框架的每一層應用5個架構原則。這種方法影響軟件、過程和支持整個交付棧的人員。
五項原則是:
可擴展性:在下一代數據中心(NGDC)中,資源庫會在不破壞原來技術層面的前提下,跨過數據中心,不斷的向外延展。預測業務需求可能需要2年、3年或者5年,這是一個不確定的問題,因為您的基礎架構是在隨著需求的變化而逐步擴展的。對于線性發展、以及預測的能力、性能的增長以及保證質量的服務(QOS)對在下一代數據中心必不可少,這使得數據中心的可擴展性成為下一代數據中心的核心。
穩定性:數據中心原有性能只占下一代數據中心解決方案的一半。服務質量控制保證必須包含數據中心全部的基礎設施或,不然,質量保證就是紙上談兵。傳統的基礎設施規劃設計不是為了平衡后期擴容網絡帶寬而設計的與大型數據中心預期的服務水平,同步的適合云服務的基礎設施。在下一代數據中心中,像CPU、內存、帶寬、存儲容量和存儲性能這樣的資源都會被動態管理,滿足需要交付的應用程序的需要,以及對應用程序預期達到目標的期望。
管理自動化:企業IT部門擔負著支持企業創新、增長的使命與責任。如果IT發展不暢,企業會給企業帶來稅收損失的風險,同時,在遇到比自己發展IT更為迅速的競爭對手時,會給自己帶來重大意義的破壞。因此,可以采用通過軟件管理,來實現自動化管理,從而通過軟件來管理關鍵點的變化,無論是硬件還是軟件,都可以通過實施管理。在使用策略驅動的配置以及資源合理分配的前提下,下一代數據中心將所有業務盡可能最大化的自動化管理,,并消除了以端點為中心的管理。如果預期的服務交付需求能夠達到規模,自動化任務編排工作流是企業的基礎。
數據的安全性: 下一代數據中心保證在沒有配置應用程序的情況下,數據中心基礎設施配合到位,保障數據信息的安全性。數據保證工程可以被比作設計地震建筑物;沒有任何建筑物能保證能承受所有地震活動,但抗震結構設計能指數級地降低災難發生的可能性。在下一代數據中心規劃中,整體規劃師允許數據中心出現故障,同時建立一個自我修復、容錯性的架構來降低故障發生的可能性。
全球效率:傳統的數據中心模型建立在這樣一個前提之上,即更多的能力需要更多的資源——無論是物理的、金融的,還是人力資源。在下一代數據中心中,企業沒有不會擁有過多的IT資源。啟用全球效率首先需要提高服務器平臺、網絡和存儲協議的利用率,以及支持每一層的供應商和IT團隊。
可擴展性
在下一代數據中心中,軟件控制的基本原則是在對數據中心的高度可擴展性中體現出來的。由于能夠提供無縫的、透明的資源擴展,而省去傳統基礎設施遷移的成本,以及實施期間的復雜性,因此可擴展性將成為企業IT部署的主要架構。
擴容與可擴展性
擴大架構允許擴展有限的變量,因為每個組件的能力限制了它們的集體性能。數據和應用程序通常會激增,最終,在一個規模擴大的架構中,最終將達到最大容量。
隨著應用程序的增加,基礎設施資源也會被分散,性能也會下降。使用一個擴容(scale-up)架構,您所操作的硬件決定了您的限制,并且更快的硬件可能需要大量的遷移工作。
相比之下,可擴展(scale-out)架構是一個分布式架構。它不局限于單個機器的資源容量。它提供了所有變量的線性擴展,允許您通過集群資源進行擴展或縮小。可擴展架構提供了廣泛的資源擴展選項,允許企業長期的跨過數據中心基礎設施對IT設施進行長期投資。
成功實現可擴展(scale-out)架構的關鍵是確保其他節點的性能可以通過QoS功能進行智能配置。
如果工作負載在性能方面不能彼此保護,那么應用程序所有者將不支持合并。 可擴展(scale-out)架構是為企業設計的,IT資源的增量增長是全球IT戰略的一部分。
可擴展性趨勢:
傳統數據中心的資源集群依賴于專用的、物理的服務器以及其他資源。這些服務器以及它們的足跡,規定了可以管理或存儲的最大數據。VMware、 VSphere之類的虛擬化技術是基于將隔離資源集中到共享池的概念構建的。
這種策略是在云中并行處理應用程序、負載平衡、容錯(冗余)的關鍵。共享資源可以幫助它實現快速的、非破壞性的修改,使用單一的控制軟件。將另一個服務器添加到資源庫中有效地擴展了CPU和內存,并且可以通過擴展或輸出資源來滿足不斷變化的業務需求。
葉脊(leaf-spine)拓撲網絡:
在采用以太網結構之前,網絡拓撲結構分層構建,層次結構類似于分層結構,通常分割成多個禁止VM和其他設備位置的Pod。為企業網絡而設計的傳統模式包含在內核心路由器,匯聚交換機和接入層傳統上需要使用Spanning的交換機樹協議(STP)來促進縮放。 這種拓撲給網絡設計和網絡設計增加了很多復雜性故障排除。
葉脊(leaf-spine)拓撲網絡:葉脊網絡拓撲結構現在事實上是一個標準——供應商的各種以太網產品設計基本都可以應用在這種結構。因為葉脊網絡拓撲結構有幾個理想的特性,能充分發揮網絡的優勢。所有橫向的主機在網絡位置上是平行的。葉脊網絡擴大接入和匯聚層。一個主機可以通過葉支交換機(leaf)和另一個葉支交換機上的主機進行通信,而且是獨立的通道。這種網絡可以大大提高網絡的效率,特別是高性能計算集群或高頻流量通信設備,葉脊網絡里使用所有的互連鏈路,是傳統的三層設計采用生成樹一預防環路協議。如前所述,生成樹檢測回路,然后在回路的位置進行標記和隔離,以防止形成回路。這意味著,雙路接入交換機只能使用兩個上行鏈路其中的一個。而新的代替協議,如SPB和TRILL允許接入設備之間的所有鏈接都接入網絡,使網絡規模隨著流量增長。
葉脊結構設計只有兩層:葉子和脊柱。葉子層中的訪問交換機連接到VM、防火墻、邊緣路由器和負載平衡器等設備。網絡的骨干是帶有交換機的脊椎層執行路由。
每個葉脊交換機通過動態第3層路由和等價多路徑(ECMP)與每個主干交換機相互連接。調整和確定最佳路徑是基于對網絡變化的響應。 隨著葉脊架構擴展到數千個節點,接入層交換機之間的延遲和瓶頸。在傳統架構中很常見 - 因為這些交換機距離不到一個單跳,所以最小化。
ECMP(Equal-CostMultipathRouting)等價多路徑,存在多條不同鏈路到達同一目的地址的網絡環境中,如果使用傳統的路由技術,發往該目的地址的數據包只能利用其中的一條鏈路,其它鏈路處于備份狀態或無效狀態,并且在動態路由環境下相互的切換需要一定時間,而等值多路徑路由協議可以在該網絡環境下同時使用多條鏈路,不僅增加了傳輸帶寬,并且可以無時延無丟包地備份失效鏈路的數據傳輸。
ECMP最大的特點是實現了等值情況下,多路徑負載均衡和鏈路備份的目的,在靜態路由和OSPF中基本上都支持ECMP功能。
但是實際情況是,各路徑的帶寬、時延和可靠性等不一樣,把Cost認可成一樣,不能很好地利用帶寬,尤其在路徑間差異大時,效果會非常不理想。例如,路由器兩個出口,兩路徑,一個帶寬是100M,一個是2M,如果部署是ECMP,則網絡總帶寬只能達到4M的利用率。
像Arista這樣的網絡供應商正在使用這種NGDC拓撲來支持速度、密度、可預測性和可伸縮性。即使在計算和網絡管理員開始利用云的效率時,固態數組仍然是靜態的。
在現有存儲中,企業別無選擇,只能使用單獨的存儲網絡和不同的資源庫
,用于不同的性能級別和關鍵應用程序。管理傳統的擴容(scale-up)架構的管理員需要添加一個固定數量的驅動器架子來增加容量。
這些磁盤陣列需要為未來的擴展所需的所有資源預先投入資金。
固態陣列正在擴展曾經的孤立的、靜態的存儲生態系統。在下一代數據中心中,存儲庫(GB、IOPS)是共享資源。集群這些資源的能力提供了增量的、需要的、需要的擴展;它只購買和管理今天的業務需求。
下一代數據中心擴展存儲提供了獨立的靈活性,可隨時間以可預測的線性模式無中斷地擴展容量和性能。 這意味著企業可以策略性地擴大或縮小數據范圍,并在任何數量的節點上分配數據和流量,同時增加數據服務的范圍。
IT通過在存儲層中利用云的彈性,并與所有其他服務、資源和云管理平臺緊密集成,從而提高效率。
保障性能
在下一代數據中心中,提高性能只是解決方案的一半;僅僅提供服務還不夠好。服務質量資源控制必須在數據中心整個基礎設施中貫穿,否則看不出效果。CPU、內存、帶寬、存儲容量和存儲性能都是動態管理的,以交付預期和所需的應用程序體驗。
保障性能的趨勢
監控系統的數據就是數據中心重要信息。 監控自控化管理工具向管理人員實時提供IT情況,包括IT 使用管理情況以及IT所需資源。企業通過軟件監控得出的報告,進行實時分析。 這些工具可以提高服務水平,管理安全風險并降低運營成本。
Splunk公司是建立領導力的公司之一在監測工具中的位置。 IT Service Intelligence(ITSI)是數據中心基礎設施可視化監控分析平臺。
ITSI在生產環境中使用可視化面板管理性能指標(KPI)和基礎設施,并提供用于問題評估的挖掘數據。該軟件是為其在前提、云端或混合環境中的操作而開發的。用戶引用事件調查、更強的安全性、可用性和商業洞察力作為實現該軟件的好處。該軟件是為其在前提、云端或混合環境中的操作而開發的。用戶引用事件調查、更強的安全性、可用性和業務關鍵洞察作為實現該軟件的好處。
在下一代數據中心中的網絡QoS,企業架構師通過將網絡流量劃分為優先級隊列來管理性能,同時控制存儲或應用程序中使用的管道的數量。
網絡QoS的設計是在不影響其他數據流的前提下,保證核心應用程序流量的使用,并允許對帶寬進行優化控制。
在網絡層應用QoS是一個主要的推動因素促進融合和端到端的服務水平
協議。 英特爾的營銷項目經理BrianYoshinaka解釋了網絡基礎設施的影響
選擇:
“今天,隨著IT部門準備部署內部云環境,評估網絡的重要性
基礎設施的選擇將影響云的能力滿足其服務水平協議(SLA)。 一般條款
用來描述云計算功能,比如:迅捷性,靈活性和可伸縮性應該絕對適用于
底層網絡也是如此。“
在存儲系統中使用存儲QoS,術語QoS在行業供應商中缺乏一致的定義,這在IT決策者中引起了質疑。現有存儲模型在離散的存儲資源上操作各種虛擬工作負載。
該模型是為了保護單個應用程序在單個存儲陣列中的性能和可用性,當每個應用程序都有一個必須支持的不同的輸入/輸出模式時。盡管這些系統可以按需提供容量,但它們卻難以有效地分配性能資源,因為它們不是為了支持集體工作負載的單個容量和性能需求而構建的。
然后,企業購買的存儲空間超過了他們所需要的,從而提高了成本,降低了效率。ESG實驗室分析師特拉維夫考夫曼解釋了遺留平臺的挑戰:
“傳統的存儲基礎設施已經演化為更好地滿足企業工作負載的需求,因為它們可以利用新技術。
但“進化”和“融合”意味著妥協;這與為任務而構建的目的不一樣。傳統的存儲架構可以配置為滿足當今大多數合并工作負載的SLA,但這樣做通常需要對基礎設施的過度供應和過度開銷,這些基礎結構是不靈活的、復雜的管理,以及對業務需求的響應緩慢
在下一代數據中心中,存儲服務質量意味著性能通過確保控制在粒度級別上執行
保證每個存儲資源的數量應用。
無論任何其他應用程序活動,容量級別或I / O模式如何,為每個預配置的應用程序分配了保證的IOPS數量,并保持分配的IOPS始終如一。
下一代數據中心使用基于節點的無共享存儲設計,可以在不增加應用程序的情況下擴展和整合工作負載。 它可以根據對業務的要求和價值提供一致的,可預測的性能
,同時隔離并保護其他人的工作負載或硬件/軟件故障。
對于下一代數據中心的確保存儲設計中的性能與容量之間的精密平衡,使得確保真正意義上的QoS性能得到保障、同時降低運營成本。
下一代數據中心存儲體系結構中現在提供了計算資源中啟用的虛擬化功能:資源庫與隔離單獨的資源,保留資源用于關鍵工作負載以及動態地移動工作負載。