AMD日前專門召開技術會議,首次披露了Zen CPU的架構設計,并公開展示同頻8核心16線程下可以戰平Intel Core i7-6900K。不過,當時關于架構只講了一些大概的情況,而今在Hot Chips 2016大會上,AMD又首次公布了Zen架構的諸多細節,詳細解釋了40%的提升是怎么來的。首先,所謂40%提升指的并非實際性能,而是每時鐘周期指令數(IPC)這一理論指標的變化,對比對象是當前的Excavator挖掘機架構。
這就是Zen架構在性能、能耗方面的一些具體改進,其中核心引擎改進包括:每核心支持兩個邏輯線程、分支誤預測改進、更好的分支預測、更大的操作緩存、更寬的微指令分派、更大的整數/浮點指令調度器、更大的回退、更大的回退/載入/存儲序列。
緩存系統有一級緩存寫回、更快的二級/三級緩存、更快的浮點單元載入、更好的一級/二級數據預取器、一級/二級緩存帶寬提升接近1倍、三級緩存總帶寬提升最多4倍。
為了降低功耗,Zen架構也是做了大量工作,全程采用低功耗設計理念,包括多層級時鐘門控、一級緩存寫回、更大操作緩存、堆棧引擎等等。
核心微架構細節:拾取四個x86指令、操作緩存指令、四個整數單元、兩個存儲/載入單元(支持72個亂序載入)、兩個浮點單元(128-bit FMAC)、4-way 64KB一級指令緩存、8-way 32KB一級數據緩存、8-way 512KB二級緩存、8MB共享三級緩存。
指令拾取部分
解碼部分
執行部分
載入/存儲單元和二級緩存
浮點單元
緩存一致性
CPU Complex(CCX):這個昨天解釋過了。Zen架構雖然每四個核心為一組,但這四個核心除了共享三級緩存之外沒有其他任何關聯,是彼此完全獨立的。
同步多線程(SMT):所有指令僅支持單線程模式,前端隊列劃分優先級,除微指令隊列、回退隊列、存儲隊列之外絕大部分模塊都是完全共享的。
新增指令集:ADX(擴展多精度算法)、RDSEED(補充RDRAND隨機數生成器)、SMAP(高級模式訪問攔截)、SHA1/SHA256(哈希加密算法)、CLFUSHOPT、XSAVEC/XSAVES/XRSTORS、CLZERO(清理緩存行)、PTE Coalecing(4K頁表合并為32K頁),其中最后兩項是AMD Zen架構獨有的。
同時繼續支持所有標準指令集:AVX、AVX-2、BMI1/2、AES、RDRAND、SMEP。