數據中心架構的一個關鍵重點是提高效率,以獲得最佳的資本回報率,最大限度地提高產量和功耗限制。核心處理器在數據中心優化中發揮重要作用,影響可擴展性和效率的處理器架構選擇的影響是巨大的。要想實現這些載體之間的理想平衡,需要有遠見卓識,創造力,以及創新能力。
具有幾十年架構的專用數據中心CPU和平臺體現在英特爾公司廣泛的產品組合中。英特爾公司多年來不斷創新其核心計算能力,以提高處理器性能。但其工作并不止于此。同樣重要的是所有核心處理器之間的連接性和可擴展性的進步,微調內存層次結構和I/O增強功能,以確保構成數據的主要構建塊的計算、網絡和存儲系統的可擴展性和效率。
成長的煩惱:規模的挑戰
添加更多核心處理器并將其互連以創建多核數據中心處理器的任務可能聽起來很簡單,但CPU核心,內存層次結構和I/O子系統之間的互連提供了這些子系統之間的關鍵路徑,從而需要深思熟慮的體系結構。這些互連就像一條精心設計的高速公路,在關鍵的地方有適當的車道和坡道,以便交通順暢。
增加核心處理器數量,提高每個處理器的內存和I/O帶寬,以滿足大量數據中心工作負載的需求,這些挑戰必須通過創新的架構技術來解決。這些挑戰包括:
•增加內核處理器和芯片上緩存層次結構,內存控制器和I/ O控制器之間的帶寬。如果可用的互連帶寬與處理器上的其他資源不能正確擴展,則互連將成為限制系統效率的瓶頸,如令人沮喪的交通堵塞的高峰時間。
•從芯片上緩存,主內存或其他內核訪問數據時減少延遲。訪問延遲取決于芯片實體之間的距離,發送請求和響應所需的路徑以及互連操作的速度。這類似于在分散式和緊湊型城市中的通勤時間,可用路線的數量以及高速公路上的速度限制。
•創建高效節能的方法,從芯片緩存和存儲器向核心處理器和I/O提供數據。由于每個組件的距離和帶寬需求的增加,當添加更多核心處理器時,數據移動完成相同任務所需的能量就會增加。在這個交通示例中,隨著城市的增長和通勤距離的增加,通勤期間浪費的時間和精力減少了生產性工作的資源。
英特爾公司致力于創新架構解決方案,以創造更強大和更有效的處理器來應對這些挑戰,以滿足諸如人工智能和深度學習等已建立和新興工作負載的需求。
構建未來的數據中心處理器
英特爾公司已經將其經驗和創新應用于為即將推出的英特爾至強可擴展處理器開發新架構,為現代數據中心提供可擴展的基礎。這種新架構提供了一種互連片上組件的新方法,以提高多核處理器的效率和可擴展性。
英特爾至強處理器實現可擴展的創新的“網格”的片上互連的拓撲結構,提供低延遲和高帶寬的內存,在核心和I/O控制器上。圖1顯示了網格架構的表示,其中核心,片上緩存組,存儲器控制器和I/ O控制器以行和列組織,電線和開關在每個交叉點連接它們以允許轉彎。通過提供比現有環結構更直接的路徑和更多的消除瓶頸的途徑,網格可以在較低的頻率和電壓下工作,并且仍然可以提供非常高的帶寬和低延遲。這將提高性能和更高的能源效率,類似于一個設計良好的公路系統,使交通流量以最佳速度流通而無阻塞。
網格體系架構概念表示
除了提高片上互連的連接性和拓撲結構外,英特爾至強可擴展處理器還實現了具有可擴展資源的模塊化架構,用于訪問片上高速緩存,內存,I/ O和遠程CPU。這些資源分布在整個芯片上,因此“熱點”或其他子系統資源約束被最小化。架構的這種模塊化和分布式方面允許可用資源隨著處理器核心數量的增加而擴展。
可擴展和低延遲的片上互連框架對于共享的最后一級緩存架構也是至關重要的。這種大型共享緩存對于復雜的多線程服務器應用程序(如數據庫,復雜物理模擬,高吞吐量網絡應用程序以及托管多個虛擬機)非常有用。訪問不同緩存庫時的差異潛在差異允許軟件將分布式緩存庫視為一個大型統一的最后一級緩存。
因此,應用程序開發人員不必擔心訪問不同緩存庫的可變延遲,也不需要優化或重新編譯代碼,從而使其性能得到顯著的提升。統一的低延遲訪問同樣的優點也可以傳遞到內存和IO訪問以及多線程或分布式應用程序,其中不同內核的執行與來自IO設備的數據之間的交互無需仔細地映射內核上的協作線程單個插座可以獲得最佳性能。因此,這樣的應用程序可以利用更多的核心處理器,并且仍然實現良好的可擴展性。
結論
具有網狀拓撲的片上互連的新架構為集成Intel Xeon可擴展處理器的各種組件(內核,緩存,內存和I/O子系統)提供了非常強大的框架。這種創新的架構可以在最廣泛的使用場景下實現性能和效率的提升,為英特爾公司及其無與倫比的全球生態系統持續改進提供基礎,以提供數據中心客戶期望的計算能力和效率的解決方案。