現在,挑戰即將來臨,AMD準備祭出的Zen架構貌似具有巨幅的性能提升,加上AMD原本具有的圖形性能優勢,Intel不可避免感受到新一輪大戰來臨的氣息。同時,無論是蘋果還是聯想、HP、戴爾這些PC廠商,它們的產品線都到了更新換代的關口。Intel第七代Core架構“KabyLake”也因此備受矚目,它也是我們接下來要分析的對象。
Kaby Lake的14納米工藝
我們知道,Intel的Tick-Tock工藝、架構兩步走策略已經實施很多年了,過去按照第一年更新架構,次年就同架構升級制造工藝,接下來一年再更新架構,如此交替穩步進行。這種方式很穩妥,保證了工藝良率,產品性能也能夠持續地提升。
14納米的Kaby Lake晶圓
Kaby Lake的芯片核心布局圖,集成了CPU、圖形核心、內存控制器以及I/O功能
14納米工藝:更好的晶體管性能
但是到了14納米階段,Tick-Tock模式就出現問題了,本來在今年,Intel就應該切換到10納米階段,這個過程顯然不太順利。Intel仍然需要依靠成熟的14納米工藝來解決問題,為此,Intel將產品線更新換代分為工藝、架構、優化三步走的方案,更新周期從過去的24個月延長到36個月,這就意味著性能提升的腳步不可避免變得更慢,Intel也必須在優化工作上下更多的工夫。
CPU架構部分,Kaby Lake繼承了Sky Lake核心、也就是第六代Core架構,所以光從IC設計角度來看,Kabylake的CPU性能實際上是止步不前的。唯一不同之處在于,Intel對14納米工藝進行改良升級、號稱14納米,新工藝擁有更好的晶體管性能。Kaby Lake的晶體管性能比前代產品提升了將近12%,這給它帶來了更出色的能效表現。
Kaby Lake與前幾代Core架構的能耗對比
再來看看Intel給出的對比表,如果以2010年的第一代Core架構為參照物,當時能耗最低的移動處理器功耗為18瓦,到了第四代架構時,功耗降低到11.5瓦,能效提升高3.5倍;而到第六代Core,能耗進一步降低到4.5瓦,能效提高了整整八倍!那到了現在的kaby lake,雖然最低能耗保持在4.5瓦,但性能提升顯著,能效比的提升幅度達到了10倍!也就是相對于現在的第六代Core,Kaby lake的能源效率提升了20%。
增強的Speed Shift技術:加快響應速度
在第六代Core架構中,Intel引入了一項名為“Speed Shift”的電源管理技術,它主要改進了系統的突發響應時間。Intel過去一直采用SpeedStep移動電源管理技術,配合操作系統,可以根據工作負載的不同、動態地調節處理器的工作頻率和能耗,從而達到節能的目的。但這項技術的缺點是必須經過操作系統,頻率的切換速度較慢、最快也得30毫秒。Speed Shift技術很好地解決了這個問題,它繞過了操作系統、讓處理器能夠直接與電源控制單元溝通,并將所有電源狀態都開放給操作系統,三者配合之下,SpeedShift平臺最快可以在1毫秒的時間內完成狀態切換。
Speed Shift帶來更快的頻率切換響應
不過,第六代Core架構的SpeedShift只針對原先的節能機制,Intel還有一項睿頻(turbo boost )技術,它的邏輯剛好與SpeedStep相反——睿頻可以在CPU面對高負載應用下將運行頻率提高數百個MHz,達到加速運行的目的。不過第六代Core的睿頻切換延遲需要接近100毫秒,而現在Kaby Lake平臺也對此作出改進,新一代SpeedShift技術可以讓睿頻狀態的加速延遲降低到5毫秒。
要說明的是,是否開啟Speed Shift,CPU的性能基準都是一樣的,它的功能在于能夠大大提高不同負載的切換速度,從而將性能效率提升最多20%。
更高頻率帶來顯著性能提升
體現在最終產品上,就是Kaby Lake可以在同等功耗時工作在更高的頻率上,比如同樣為15W功耗,Kaby Lake核心的Core i7 7500U的頻率為2.7GHz,睿頻最高到3.5GHz;而現有的Core i7 6500U頻率只有2.5GHz,睿頻最高只有3.1GHz,差距還是比較明顯的。在體現商用性能的Sysmark 2014評測軟件中,7500U的性能比6500U高出12%左右;在Web性能的WebXPRT 2015的評測軟件中,7500u的性能提升達19%。不過最大幅度的提升還是WinRAR壓縮解壓應用,7500U的優勢擴大到28%,這主要得益于睿頻時額外增加的400MHz頻率提升。
Kaby Lake 核心的Core i7 7500U與上一代6500U的性能對比
Kaby Lake的GPU部分
kaby Lake的GPU核心同樣繼承上一代產品,在Intel的體系中仍屬于第九代架構,圖形核心依然由EU單元構成,內部設計沒有什么變動。根據處理器版本不同,Kaby Lake的GPU也分為GT2、GT4等多種配置,性能最高的GT4包括72個EU執行單元,GT2為24個執行單元,數量與第六代Core相同,不同的地方在于Intel提升了eDRAM 四級緩存的配置——比如最高性能版本可以集成256MB的eDRAM四級緩存,而現有第六代核心最高只能到128MB。
在沒有明顯改動EU單元內部設計、提高EU數量的情況下,指望Kaby Lake的圖形性能有大幅度提升是不現實的,這對于用戶來說多少會有些遺憾。但Intel的問題在于,如果AMD的Zen架構能夠按期在2017年發布,那么Zen架構有望在處理器性能方面趕上Intel,而圖形性能又是AMD的強項。所以對Intel來說,Kaby Lake一如既往的圖形性能會有一些麻煩,至少用戶對它們會很不感冒。
值得慶幸的是,Kaby Lake在視頻性能方面獲得大幅度的增強,Intel為它加入了增強的視頻引擎,它包括MFX(Multi-Format Codex ,多媒體解碼器)和VQE(Video Quality Engine ,視頻質量引擎)兩個部分。
MFX單元與VQE引擎
MFX是一個增強的解碼器單元,它增加了10bit HEVC和8/10bit VP9格式的編碼器和解碼器。其中,HEVC是一套先進的視頻格式標準,它可以讓1080P視頻內容的壓縮效率提高50%左右。這項優勢讓它被認為是H.264、MPEG-4的最佳代替者,能夠滿足4K、8K視頻時代的內容壓縮要求。不過,HEVC也因此具備更高的算法復雜度,對硬件要求要比H.264高得多,之前Intel的核顯只提供到8bit的HEVC硬加密能力,面對10bit HEVC內容時仍只能依靠CPU低效地完成。而在Kaby Lake架構中,新加入的MFX單元將讓觀看4K HEVC高清內容變得輕松自如。
VP9則是Google開發的視頻格式,它是一套開放的壓縮標準,可以提供比H.264更好的圖像質量、同時碼率卻只有它的一半左右。這次Kaby Lake納入了VP9的編解碼功能,支持8bit的硬編碼和8bit/10bit的解碼,可以讓Kaby Lake平臺在在線視頻應用中具有顯著的性能提升。
除了這兩項重要改進外,Kaby Lake的MFX單元還改善了無線顯示時的畫面質量,也提升了現行H.264/MPEG-4 AVC編解碼的性能。
MFX、VQE的詳細改進點
VQE引擎則在第四代Core架構時開始引入,現在它有了新功能:具有更寬的色域,并且在高動態范圍和標準動態范圍下都能獲得應用。為了實現這一點,Intel對VQE引擎作了進一步改進,包括反交錯、降低噪音、色彩增強、色彩校正等等。同時,新一代VQE還擁有更好的能效表現:在實現寬色域和HDR支持時,它只需要消耗40-50毫瓦的能源,讓它在播放4K內容時,能夠提供更好的畫面觀賞效果,同時不需擔心設備發熱會顯著上升。
Kaby Lake獲得增強的MFX/VQE媒體引擎
實際性能增強
KabyLake的上述改進,讓它得以勝任4K時代的現實需求。用數據能更直觀地看出這一點。
KabyLake平臺,可以支持最多8組4Kp/30(4K逐行、30幀速率)的超高清視頻同時播放;或者是流暢地播放4Kp/60(4K逐行、60幀速率)的高質量視頻,此時視頻的流速達到120Mbps,這意味著Kaby Lake的媒體引擎要在一秒內完成120Mbit數據的實時解碼,運算力相當強大。而它的能源效率也非常可觀:功耗只有4.5W的Y系列處理器,就可以完成HEVC格式的4Kp/30視頻的實時編碼,也就是像Macbook這樣的超輕薄小本,都可以很好完成這類繁重的視頻創建任務。
那么對終端用戶來說,換用新平臺和沿用現行的第六代平臺,又能帶來多少實際的好處呢?首先一個最明顯的好處就是降低了能耗。Intel采用《鋼鐵之淚(Tears of Steel)》的開源電影短片來展示兩代平臺的差異,視頻基于10bit HEVC格式、4K清晰度,在現行的Core i7-6500U平臺中,視頻播放是依靠GPU和CPU一起混合解碼的,此時CPU占用率要達到50%左右,而CPU/GPU的整體能耗達到10.2瓦。另一套Kaby Lake架構的對比平臺則采用對應的Core i7-7500U處理器,由于它可以完全由CPU進行硬解碼,CPU/GPU的功耗只有驚人的0.5瓦—這也意味著足足具有20倍的能源效率提升,而播放本地4K視頻時的電池續航時間也因此可以提升2.6倍之多!
在4K HEVC 10bit內容解碼時,Kaby Lake平臺展現出強大的能耗優勢
如果應用的對象換為在線視頻、結果會如何呢?對比的上述兩個平臺都用Chrome瀏覽器來播放Youtube上的4K VP9格式視頻,其中Core i7-6500U在CPU/GPU部分用了5.8瓦能源,而Core i7-7500U只用了0.8瓦,能耗降低了7倍!
換算過來,在播放Youtube的4K視頻時,KabyLake平臺可以獲得1.75倍的額外電池續航時間。目前基于Corei7-6500U的筆記本電腦,在播放這類4K視頻時一般具有4小時左右的續航力,那么按此推算、Core i7-7500U平臺就能達到7小時左右。
不僅如此,Kaby Lake提供的性能冗余也讓它為未來做好了準備,比如它可以勝任360度的4K內容、也就是沉浸式的4K VR應用,而當前的第六代Core平臺無法滿足這一點。
Kaby Lake與第六代Core架構在視頻方面的功能對比
Kaby Lake的產品線分布
與前次升級一樣,KabyLake擁有一個完備的產品線,包括S系列、H系列、U系列和Y系列,跨越從高性能桌面、工作站到超輕薄筆記本的廣闊市場,具體到產品型號上還是劃分為i7、i5、i3三個不同等級。
面向主流市場的仍然會是i3、i5和i7三個系列
針對桌面和工作站:S系列
S系列面向的是高性能市場,它包含許多不同的型號,主要以鎖頻與否、功耗和GPU配置作為區分。其中性能最高的是K開頭的型號,它擁有四個處理器核心,搭載GT2級別的常規圖形核心,最大的特點是不鎖倍頻、允許大家自由超頻,功耗達91瓦。這個系列將在2017年初發布。
Kaby Lake S系列平臺架構
面向主流桌面的四核處理器則鎖了倍頻,功耗在35瓦到65瓦之間,它搭載了性能更高的GT4圖形核心,內部集成了64MB的四級緩存,它的發布時間比不鎖頻的K系列稍遲一些。
而針對服務器和工作站的Xeon系列四核處理器,沒有整合圖形核心的有80瓦、54瓦和25瓦三種能耗配置,主要面向需要與GPU加速卡配合的高性能計算平臺。而帶GT2圖形核心的有25-80瓦能耗配置,主要面向Web服務器、文件服務器、FTP服務器這類常規的商業云環境。
S系列的芯片平臺采用“處理器PCH”的組合方案。處理器部分,S系列支持雙通道DDR3L-1600和DDR4-2400兩種方案,OEM廠商可以自行決定要采用哪種內存。此外,它還包括一條PCI Express 3.0X16規格的圖形總線、用于外接顯卡,接口的帶寬達到32GB/s。另外,它還支持三路數字顯示接口輸出,以及一個eDP嵌入式接口。
PCH方面,Kaby Lake可以兼容第六代Core的100系列芯片組,不過它配套的應該是改進后的200系列產品,除了USB 3.1支持、HDA高清音頻、SATA硬盤總線外,200系列芯片將原本的20路PCIExpress 3.0總線提升到24路,總計提供48GB/s的雙向帶寬,可以支持Intel的Optane硬盤。它實際上是Intel的3D XPoint閃存技術的正式名稱,介于傳統內存、固態硬盤之間,可以提供極高的性能和極低的延遲。
針對高性能筆記本電腦:H系列
H系列是Kaby Lake的移動高性能版,它采用BGA1440封裝、TDP功耗在35-45瓦范圍內。H系列都擁有四個CPU核心,35瓦功耗版搭載標準版的GT2圖形核心,面向主流高性能市場。不過,Intel還為頂級玩家準備了45瓦功耗的頂級型號,它將搭載GT4圖形核心,并內建了128MB的eDRAML4高速緩存。不過它還不是最快的,Kaby Lake H家族還包含一款高達256MB L4緩存的頂級型號,沒有例外的話,它也將成為Kaby Lake家族中圖形性能最出色的處理器。
H系列同樣采用處理器PCH的解決方案,功能強大、但需要較大尺寸的主板才能容納。
針對超極本:15/28瓦的U系列
U系列是Kaby Lake的移動低功耗版本,主要針對的是超極本市場。U系列采用BGA1356封裝,功耗最低的版本TDP為15瓦,最高的型號是28瓦。U系列都包括兩個CPU核心,圖形部分有GT2、GT3兩個版本,兩者的區別主要是內建的eDRAM四級緩存——GT2版本并不包含、只能共享內存作為顯存,而GT3內建了64MB的eDRAM,性能會更出色一些。
U系列有一個很重要的特點就是內建了SOC功能,也就是將PCH芯片與KabyLake CPU芯片集成在一起,這樣就在一個處理器封裝模塊上同時實現包括CPU、圖形核心、芯片組等所有的功能,主板的設計尺寸因此可以被大幅度縮小。可以見到,當前搭載第六代Core架構U系列處理器的超極本都可以做到驚人的輕薄尺度,原因也是處理器封裝里包括PCH芯片。
kaby Lake U系列處理器,處理器和PCH芯片集成在一起
Kaby Lake U系列的邏輯架構,采用雙芯片、單模塊的SOC集成設計
內存支持方面。U系列也是雙通道DDR3L和DDR4,不過它在I/O方面的功能久相對弱一些,比如只支持兩路數字顯示輸出和一個嵌入式eDP顯示接口,更遺憾的是只能支持到USB 3.0,未免有些落伍。此外,對于SSD它準備了SATA和PCIExpress兩種接口,可以很好地滿足現實需要。
針對平板電腦:4.5瓦的Y系列
Y系列其實就是之前的Core M產品,面向的是平板電腦以及追求極致輕薄的超便攜機型。Y系列采用BGA1515封裝,它的主要訴求是低至4.5瓦的超低功耗水平,這讓它可以保持無風扇運行。Y系列都整合了GT2圖形核心、不帶eDRAM高速緩存。由于Y系列面向尺寸更小的計算市場,處理器封裝也采用SOC設計、同樣集成了PCH芯片。I/O功能與U系列完全相同,它也沒法原生支持USB 3.1。
同樣雙芯片、更為緊湊的Y系列
需要換Kaby Lake平臺么?
如果你已經在用六代平臺或者四五代平臺,純粹因為性能的關系升級到七代平臺,我們認為你或多或少會覺得失望,Kaby Lake平臺的性能固然得到提升,視頻方面的能力也非常強大,但它更多是一種漸進式的改進。
Intel也深知這一點,它采用五年前的PC平臺作為參照物加以說明。對比五年前的平臺,Kaby Lake在商務應用中可以獲得1.7倍的性能提升;此外,Kaby Lake可以很好地勝任4K視頻創次建和播放的需要。通俗一點說,我們認為五年前的PC也能夠完成大多數日常任務,但如果升級到Kaby lake平臺,大家可以直觀地感受到運行速度更快、CPU占用率更低、平臺的發熱量更小、風扇更加安靜。假如你要在電腦中運行多個虛擬機,那么就會恨不得榨取每一分的性能,Kaby Lake平臺在這些方面就有明顯優勢。從這些人性化體驗的角度來看,我們認為升級到新一代平臺還是有著明顯的好處。
AMD ZEN處理器的各種“泄漏”,相信也給了Intel一定的壓力和動力
只不過,Intel還需要面對的一個潛在問題,就是AMD的Zen架構能具有什么樣的表現,假如Zen在處理器性能和效率上趕上Intel的步伐,那么Intel將重新經歷久違的市場競爭——畢竟AMD在圖形領域具有不對稱的優勢,它所欠缺的其實就是一個強有力的CPU平臺。我相信消費者樂見于此,沒有競爭,市場只會一潭死水、廠商缺乏前進的動力,我們也無法看到IT技術所應有的高速演進。