英特爾公布關于其下一代“Knights Landing”至強Phi多核心處理器的更多細節信息,其中包括名為英特爾Omni Scale Fabric的全新高速互連技術以及封裝在芯片中的美光Gen2 Hybrid Memory Cube(簡稱HMC)DRAM——其最大容量為16GB。
英特爾的Silvermont凌動處理器微架構開始向高性能計算領域邁進
“英特爾通過將Omni Scale Fabric集成到Knights Landing當中的方式對高性能計算系統的基礎構件進行了重新構建,從而為高性能計算業界帶來重要的發展轉折與里程碑,”英特爾公司副總裁兼工作站及高性能計算業務總經理Charles Wuischpard在一份聲明中指出。“Knights Landing將作為第一款真正的多核心處理器,旨在解決目前困擾用戶的內存與I/O性能挑戰。”
這套新的結構不僅將被用在Knights Landing處理器當中——根據英特爾方面的說法,它計劃于2015年年底開始與“超過60個基于高性能計算強化型Silvermont架構的計算核心”相對接——不過同時也將被納入到“未來的14納米英特爾至強處理器”當中。
英特爾方面指出,Omni Scale Fabric以該公司的“內部創新”成果以及從克雷與QLogic收購獲取的知識產權為基礎。“除此之外,”芯片巨頭報告稱,“目前主控交換機制中的傳統電子收發技術已經被基于英特爾Silicon Photonics的解決方案所取代,從而提高端口密度、簡化線纜排布并降低使用成本。”
英特爾公司同時聲稱,那些當前正在使用英特爾True Scale Fabric InfiniBand技術的客戶將迎來更多好消息:利用現有結構方案的應用程序將能夠與即將面世的Omni Scale Fabric相兼容,英特爾還將“提供計劃”以保障Omni Scale Fabric正式推出后的全面升級流程。
一直關注英特爾“Knights”系列多核心處理器開發動向的朋友們可能還記得,它們實際上脫胎自當初被棄用的圖形處理項目Larrabee、并于2010年正式被劃歸Knights Ferry“開發平臺”之下,其首個商用版本是2011年上市的基于奔騰核心的Knights Corner產品。
該芯片原本被稱為“多集成核心”處理器,也就是我們所熟知的縮寫詞“MIC”。不過這一稱謂在2012年遭到淘汰,英特爾方面決定重新為其建立“至強Phi”品牌——也許這是因為連英特爾自己也不知道到底MIC應該被稱為“Mick”還是“Mike”。
英特爾最初于去年十一月首次討論Knights Landing,并表示該方案將同時推出PCIe卡上的協處理器/加速器版本——這一點與其前輩“Knights Corner”至強Phi一樣——以及可接入插槽并用于系統啟動的CPU版本。
在去年十一月的聲明當中,英特爾還透露稱Knights Landing將同時包含內存與多核心芯片,二者共同存在于封裝當中。而就在本周一,芯片巨頭表示內存機制的開發工作由美光方面負責并將基于后者的Gen2 Hybrid Memory Cube技術。
“美光與英特爾事實上已經就內在立方技術合作了很長一段時間,”美光公司HMC技術戰略官Mike Black在接受采訪時指出。“我們已經在IDF 2011大會上展示了一套技術平臺,并在那里第一次將HMC推到公眾面前。”
讓內存與CPU核心盡可能接近一方面是出于數據傳輸速度的考量——“速度比原本高出一個量級,”Black強調稱——同時也能夠降低借由硅通孔(簡稱TSV)實現的內存分區訪問所帶來的能源消耗量。
想要獲得出色的DRAM數據吞吐能力?美光的3D Hybrid Memory Cube能夠實現這一目標
事實已經證明,硅通孔在制造層面的難度相當之高,這主要是因為我們很難保證其準確、均勻地從底部貫通到頂部。不過根據Black的說法,“我們在過去十年當中一直致力于研究硅通孔技術,并在過去三到四年內取得了長足的進步。”他坦言,美光在硅通孔開發的早期階段確實遭遇到一系列“挑戰”,但“目前大多數企業的實際使用證明了硅通孔是一項相當可靠的技術成果。”
被Black描述為“高性能封裝內存”的3D-內存堆棧屬于邏輯層(基于IBM 32納米邏輯制程)的組成部分,在此基礎上美光利用30納米制程在芯片中加入了四個或者八個內存陣列。每一個內存層都提供4Gb DRAM,因此其整體容量密度可達2GB或者4GB。
目前八層堆棧已經是3D內存堆棧所能達到的上限,他告訴我們,并表示堆棧層數越高、由此帶來的額外開發工作也就越繁重——不過他同時指出,“我們的客戶將享用到我們技術能力所能達到的極限”,從而在盡可能小的芯片體積內最大程度獲取內存容量。
在基礎層中納入內存邏輯還帶來一項額外的優勢。“由于我們已經設置了邏輯制程,”Black表示,“因此我們能夠實現更出色的先進性與彈性;我們可以在運行過程中對內存堆棧本身進行調整,從而避免即將被觸發的事件出現資源不足以及運行故障。”
英特爾目前還沒有就Knights Landing產品線的插槽或者PCIe版本放出定價信息,不過根據Black對于HMC的說明,將額外3D內存作為封裝DRAM的設計并不會給將于明年推出的全新多核心處理器產品帶來價格提升。
“從總體持有成本角度來看,”他解釋稱,“相較于目前的現有內存平臺,HMC其實處于低成本內存實施區間。”Black這里所指的“實施”效果,意味著高性能封裝內存所能達到的出色內存帶寬:高達DDR3的15倍以及DDR4的5倍。