精品国产一级在线观看,国产成人综合久久精品亚洲,免费一级欧美大片在线观看

ARM和X86之間為什么不太具有可比性?

責(zé)任編輯:vivian

2012-02-03 08:54:00

摘自:比特網(wǎng)

本文將簡(jiǎn)單的來(lái)談一下,ARM和X86之間為什么不太具有可比性的問(wèn)題。一條CISC 指令進(jìn)來(lái)以后,會(huì)被譯碼器拆分為數(shù)量不等的微碼,然后送入處理器的執(zhí)行管線(xiàn)——這實(shí)際上可以理解為RISC內(nèi)核……

本文將簡(jiǎn)單的來(lái)談一下,ARM和X86之間為什么不太具有可比性的問(wèn)題。要搞清楚這個(gè)問(wèn)題首先要明白什么是架構(gòu),之前也有很多人提到了架構(gòu)不同,但架構(gòu)是什么意思?它是一個(gè)比較抽象的概念,不太容易用幾句話(huà)就解釋清楚。

我們要明白CPU是一個(gè)執(zhí)行部件,它之所以能執(zhí)行,也是因?yàn)槿藗冊(cè)诶锩嬷谱髁藞?zhí)行各種功能的硬件電路,然后再用一定的邏輯讓它按照一定的順序工作,這樣就能完成人們給它的任務(wù)。也就是說(shuō),如果把CPU看作一個(gè)人,首先它要有正常的工作能力(既執(zhí)行能力),然后又有足夠的邏輯能力(能明白做事的順序),最后還要聽(tīng)的懂別人的話(huà)(既指令集),才能正常工作。而這些集中在一起就構(gòu)成了所謂的“架構(gòu)”,它可以理解為一套“工具”、“方法”和“規(guī)范”的集合。不同的架構(gòu)之間,工具可能不同,方法可能不同,規(guī)范也可能不同,這也造成了它們之間的不兼容——你給一個(gè)意大利泥瓦匠看一份中文寫(xiě)成的烹飪指南,他當(dāng)然不知道應(yīng)該干什么了。

如果還看不懂,沒(méi)關(guān)系,我們繼續(xù)。從CPU發(fā)明到現(xiàn)在,有非常多種架構(gòu),從我們熟悉的X86,ARM,到不太熟悉的MIPS,IA64,它們之間的差距都非常大。但是如果從最基本的邏輯角度來(lái)分類(lèi)的話(huà),它們可以被分為兩大類(lèi),即所謂的“復(fù)雜指令集”與“精簡(jiǎn)指令集”系統(tǒng),也就是經(jīng)常看到的 “CISC”與“RISC”。屬于這兩種類(lèi)中的各種架構(gòu)之間最大的區(qū)別,在于它們的設(shè)計(jì)者考慮問(wèn)題方式的不同。

我們可以繼續(xù)舉個(gè)例子,比如說(shuō)我們要命令一個(gè)人吃飯,那么我們應(yīng)該怎么命令呢?我們可以直接對(duì)他下達(dá)“吃飯”的命令,也可以命令他“先拿勺子,然后舀起一勺飯,然后張嘴,然后送到嘴里,最后咽下去”。從這里可以看到,對(duì)于命令別人做事這樣一件事情,不同的人有不同的理解,有人認(rèn)為,如果我首先給接受命令的人以足夠的訓(xùn)練,讓他掌握各種復(fù)雜技能 (即在硬件中實(shí)現(xiàn)對(duì)應(yīng)的復(fù)雜功能),那么以后就可以用非常簡(jiǎn)單的命令讓他去做很復(fù)雜的事情——比如只要說(shuō)一句“吃飯”,他就會(huì)吃飯。但是也有人認(rèn)為這樣會(huì)讓事情變的太復(fù)雜,畢竟接受命令的人要做的事情很復(fù)雜,如果你這時(shí)候想讓他吃菜怎么辦?難道繼續(xù)訓(xùn)練他吃菜的方法?我們?yōu)槭裁床豢梢园咽虑榉譃樵S多非常基本的步驟,這樣只需要接受命令的人懂得很少的基本技能,就可以完成同樣的工作,無(wú)非是下達(dá)命令的人稍微累一點(diǎn)——比如現(xiàn)在我要他吃菜,只需要把剛剛吃飯命令里的“舀起一勺飯”改成“舀起一勺菜”,問(wèn)題就解決了,多么簡(jiǎn)單。

這就是“復(fù)雜指令集”和“精簡(jiǎn)指令集”的邏輯區(qū)別。可能有人說(shuō),明顯是精簡(jiǎn)指令集好啊,但是我們不好去判斷它們之間到底誰(shuí)好誰(shuí)壞,因?yàn)槟壳八麄儍煞N指令集都在蓬勃發(fā)展,而且都很成功——X86是復(fù)雜指令集(CISC)的代表,而ARM則是精簡(jiǎn)指令集(RISC)的代表,甚至ARM的名字就直接表明了它的技術(shù):Advanced RISC Machine——高級(jí)RISC機(jī)。

到了這里你就應(yīng)該明白為什么RISC和CISC之間不好直接比較性能了,因?yàn)樗鼈冎g的設(shè)計(jì)思路差異太大。這樣的思路導(dǎo)致了CISC和RISC分道揚(yáng)鑣—— 前者更加專(zhuān)注于高性能但同時(shí)高功耗的實(shí)現(xiàn),而后者則專(zhuān)注于小尺寸低功耗領(lǐng)域。

實(shí)際上也有很多事情CISC更加合適,而另外一些事情則是RISC更加合適,比如在執(zhí)行高密度的運(yùn)算任務(wù)的時(shí)候CISC就更具備優(yōu)勢(shì),而在執(zhí)行簡(jiǎn)單重復(fù)勞動(dòng)的時(shí)候RISC就能占到上風(fēng),比如假設(shè)我們是在舉辦吃飯大賽,那么CISC 只需要不停的喊“吃飯吃飯吃飯”就行了,而RISC則要一遍一遍重復(fù)吃飯流程,負(fù)責(zé)喊話(huà)的人如果嘴巴不夠快(即內(nèi)存帶寬不夠大),那么RISC就很難吃的過(guò)CISC。但是如果我們只是要兩個(gè)人把飯舀出來(lái),那么CISC就麻煩得多,因?yàn)镃ISC里沒(méi)有這么簡(jiǎn)單的舀飯動(dòng)作,而RISC就只需要不停喊“舀飯舀飯舀飯”就OK。

這就是CISC和RISC之間的區(qū)別。但是在實(shí)際情況中問(wèn)題要比這復(fù)雜許許多多,因?yàn)楦鱾€(gè)陣營(yíng)的設(shè)計(jì)者都想要提升自家架構(gòu)的性能。這里面最普遍的就是所謂的“發(fā)射”概念。什么叫發(fā)射?發(fā)射就是同時(shí)可以執(zhí)行多少指令的意思,例如雙發(fā)射就意味著CPU可以同時(shí)拾取兩條指令,三發(fā)射則自然就是三條了。現(xiàn)代高級(jí)處理器已經(jīng)很少有單發(fā)射的實(shí)現(xiàn),例如Cortex A8和A9都是雙發(fā)射的RISC,而Cortex A15則是三發(fā)射。

ATOM是雙發(fā)射CISC,Core系列甚至做到了四發(fā)射——這個(gè)方面大家倒是不相上下,但是不要忘了CISC的指令更加復(fù)雜,也就意味著指令更加強(qiáng)大,還是吃飯的例子,CISC只需要1個(gè)指令,而RISC需要5個(gè),那么在內(nèi)存帶寬相同的情況下,CISC能達(dá)到的性能是要超過(guò)RISC的 (就吃飯而言是5倍),而實(shí)際中CISC的Core i處理器內(nèi)存帶寬已經(jīng)超過(guò)了100GB/s,而ARM還在為10GB/s而苦苦奮斗,一個(gè)更加吃帶寬的架構(gòu),帶寬卻只有別人的十分之一,性能自然會(huì)受到非常大的制約。為什么說(shuō)ARM和X86不好比,這也是很重要的一個(gè)原因,因?yàn)椴煌膽?yīng)用對(duì)帶寬需求是不同的。一旦遇到帶寬瓶頸,哪怕ARM處理器已經(jīng)達(dá)到了很高的運(yùn)算性能,實(shí)際上根本發(fā)揮不出來(lái),自然也就會(huì)落敗了。

說(shuō)到這兒大家應(yīng)該也已經(jīng)明白CISC和RISC的區(qū)別和特色了。簡(jiǎn)而言之,CISC實(shí)際上是以增加處理器本身復(fù)雜度作為代價(jià),去換取更高的性能,而RISC則是將復(fù)雜度交給了編譯器,犧牲了程序大小和指令帶寬,換取了簡(jiǎn)單和低功耗的硬件實(shí)現(xiàn)。但如果事情就這樣發(fā)展下去,為了提升性能,CISC 的處理器將越來(lái)越大,而RISC需要的內(nèi)存帶寬則會(huì)突破天際,這都是受到技術(shù)限制的。

所以進(jìn)十多年來(lái),關(guān)于CISC和RISC的區(qū)分已經(jīng)慢慢的在模糊,例如自P6體系(即Pentium Pro)以來(lái),作為CISC代表的X86架構(gòu)引入了微碼概念,與此對(duì)應(yīng)的,處理器內(nèi)部也增加了所謂的譯碼器,負(fù)責(zé)將傳統(tǒng)的CISC指令“拆包”為更加短小的微碼(uOPs)。

一條CISC 指令進(jìn)來(lái)以后,會(huì)被譯碼器拆分為數(shù)量不等的微碼,然后送入處理器的執(zhí)行管線(xiàn)——這實(shí)際上可以理解為RISC內(nèi)核+CISC解碼器。而RISC也引入了指令集這個(gè)就邏輯角度而言非常不精簡(jiǎn)的東西,來(lái)增加運(yùn)算性能。正常而言,一條X86指令會(huì)被拆解為2~4個(gè)uOPs,平均來(lái)看就是3個(gè),因此同樣的指令密度下,目前X86的實(shí)際指令執(zhí)行能力應(yīng)該大約是ARM的3倍左右。不過(guò)不要忘了這是基于“同樣指令密度”下的一個(gè)假設(shè),實(shí)際上X86可以達(dá)到的指令密度是十倍甚至百倍于ARM的。

最后一個(gè)需要考慮的地方就是指令集。這個(gè)東西的引入,是為了加速處理器在某些特定應(yīng)用上性能而設(shè)計(jì)的,已經(jīng)有了幾十年的歷史了。而實(shí)際上在目前的應(yīng)用環(huán)境內(nèi),起到?jīng)Q定作用的很多時(shí)候是指令集而不是CPU核心。X86架構(gòu)的強(qiáng)大,很多時(shí)候也源于指令集的強(qiáng)大,比如我們知道的ATOM,雖然它的 X86核心非常羸弱,但是由于它支持SSE3,在很多時(shí)候性能甚至可以超過(guò)核心性能遠(yuǎn)遠(yuǎn)強(qiáng)大于它的Pentium M,這就是指令集的威力。

目前X86指令集已經(jīng)從MMX,發(fā)展到了SSE,AVX,而ARM依然還只有簡(jiǎn)單而基礎(chǔ)的NEON。它們之間不成比例的差距造成了實(shí)際應(yīng)用中成百上千倍的性能落差,例如即便是現(xiàn)今最強(qiáng)大的ARM內(nèi)核依然還在為軟解1080p H.264而奮斗,但一顆普通的中端Core i處理器卻可以用接近十倍播放速度的速度去壓縮1080p H.264視頻。至少在這點(diǎn)上,說(shuō)PC處理器的性能百倍于ARM是無(wú)可辯駁的,而實(shí)際中這樣的例子比比皆是。這也是為什么我在之前說(shuō)平均下來(lái)ARM只有 X86幾十分之一的性能的原因。

打了這么多字,其實(shí)就是為了說(shuō)明一點(diǎn),雖然現(xiàn)在ARM很強(qiáng)大,但它距離X86還是非常遙遠(yuǎn),并沒(méi)有因?yàn)檫@幾年的進(jìn)步而縮短,實(shí)際上反而在被更快的拉大。畢竟它們?cè)O(shè)計(jì)的出發(fā)點(diǎn)不一樣,因此根本不具備多少可比性,X86無(wú)法做到ARM的功耗,而ARM也無(wú)法做到X86的性能。這也是為什么ATOM一直以來(lái)都不成功的原因所在——Intel試圖用自己的短處去和別人的長(zhǎng)處對(duì)抗,結(jié)果自然是不太好的,要不是Intel擁有這個(gè)星球上最先進(jìn)的半導(dǎo)體工藝,ATOM根本都不可能出現(xiàn)。

而ARM如果嘗試去和X86拼性能,那結(jié)果自然也好不到哪兒去,原因剛剛也解釋過(guò)了。不過(guò)這也不意味著ARM以后就只能占據(jù)低端,畢竟任何架構(gòu)都有其優(yōu)點(diǎn),一旦有應(yīng)用針對(duì)其進(jìn)行優(yōu)化,那么就可以揚(yáng)長(zhǎng)避短。

X86的繁榮也正是因?yàn)檎麄€(gè)世界的資源都針對(duì)它進(jìn)行了優(yōu)化所致。只要能為ARM找到合適的應(yīng)用與適合的領(lǐng)域,未來(lái) ARM也未必不可以進(jìn)入更高的層次。

鏈接已復(fù)制,快去分享吧

企業(yè)網(wǎng)版權(quán)所有?2010-2024 京ICP備09108050號(hào)-6京公網(wǎng)安備 11010502049343號(hào)

  • <menuitem id="jw4sk"></menuitem>

    1. <form id="jw4sk"><tbody id="jw4sk"><dfn id="jw4sk"></dfn></tbody></form>
      主站蜘蛛池模板: 安徽省| 沙坪坝区| 聂拉木县| 永济市| 北辰区| 铅山县| 大冶市| 明光市| 安泽县| 阜康市| 永胜县| 集安市| 千阳县| 南皮县| 中牟县| 元阳县| 陵水| 扎赉特旗| 抚松县| 大丰市| 梁山县| 郁南县| 南充市| 蒙山县| 简阳市| 巴塘县| 惠来县| 普陀区| 格尔木市| 安塞县| 贵港市| 本溪市| 会宁县| 肥城市| 台北县| 灌云县| 缙云县| 无为县| 龙井市| 江西省| 安义县|