精品国产一级在线观看,国产成人综合久久精品亚洲,免费一级欧美大片在线观看

當前位置:新聞中心行業相關 → 正文

CPU、GPU、FPGA、AI芯片,各種XPU哪家強?一篇文章看懂芯片產業格局

責任編輯:yang |來源:企業網D1Net  2021-07-14 15:01:17 本文摘自:至頂網

展望未來,XPU市場將呈現百花齊放的局面,各種芯片在各自的賽道發揮自身獨特的價值。同時各種計算架構之間在聚焦自身優勢的同時,也在相互融合協同,形成了“你中有我,我中有你”的局面。

2021年開年雖然業界面臨“缺芯”問題,但是眾多半導體廠商的新品發布卻是此起彼伏,“你方唱罷我登場”。

……

GTC 2021上,英偉達宣布進軍CPU,實現CPU、GPU、DPU“3U一體”

英特爾發布用于數據中心的第三代至強可擴展處理器Ice Lake以及其產品組合

AMD EPYC進化到代號“米蘭”的第三代

Arm 發布最新一代架構Arm v9,更早些時候Arm推出了面向數據中心的Neoverse平臺

……

一時間,原本涇渭分明的數據中心芯片市場變得錯綜復雜,XPU(CPU、GPU、DPU等各種服務器處理器的統稱)成為半導體芯片廠商競爭的新賽道,一條清晰的競爭主線也逐漸明顯——各大芯片企業都在構建自己的多元化產品能力。

半導體巨頭們圍繞XPU展開了積極布局的同時,在市場驅動下,各個細分領域的XPU廠商也紛紛發力,APU、TPU、IPU等各種加速芯片百花齊放,地平線、寒武紀、中科馭數等廠商涌現。特別是在外部斷供以及國產化趨勢下,國產廠商也迎來發展契機,比如龍芯、飛騰、鯤鵬等在積極構建產品與技術生態。

算力就是生產力

面對層出不窮的XPU,站在更為宏觀的視角看,這已經不簡單只是廠商之間的技術、產品、市場之爭,其背后代表了一種對先進生產力之間的追逐。

人類社會每一次科技躍遷,其本質都是計算力的突破與進化,每一次新文明的進階,都是計算方式和載體變遷帶來社會效率提升的結果。如果說在工業時代電力是基礎設施,是經濟社會發展的動力保障,那么,隨著人類社會邁入數字經濟時代,算力正在扮演相似角色。

根據中國信息通信研究院今年發布的《中國數字經濟白皮書》,2020年中國數字經濟規模達到39.2萬億元人民幣,占GDP比重為38.6%。數字經濟的基礎是對數據進行處理,也就是利用大大小小各種規模的數據中心——從幾十臺服務器的小規模數據中心到幾十萬到上百萬臺規模的超大型數據中心提供的算力,運行各種軟件來提供各種服務以支撐企業的生產經營和消費者的各種消費服務。由于計算力的大小代表了對數據處理能力的強弱,因此,計算力自然成為數字經濟的核心要素,是核心生產力。

IDC發布的《2020全球計算力指數評估報告》也表明,計算力與經濟增長緊密相關,計算力指數平均每提高1個點,數字經濟和GDP將分別增長3.3‰和1.8‰。

當前,各個國家的數字經濟占比將持續提升,而數字經濟和算力需求處于循環增強的狀態,同時,新興技術的投入與算力投入相關性極高,算力為新興技術應用提供基礎保障,新興技術的發展進一步推動算力提升,其中物聯網、人工智能和大數據的相關性最為顯著,新興技術和算力呈現相互拉動效應。

正是看到了算力在數字經濟發展中的重要作用,全國一體化算力網絡國家樞紐節點建設也于近期正式啟動,其將成為中國數字經濟發展的新基座。

總之,算力不僅僅是一個技術指標,而是先進生產力的代表。未來,算力與數字經濟共促共進的關系將進一步強化:即算力不斷發展推動數字經濟持續向前,數字經濟持續向前加重對算力的支撐依賴,“算力經濟時代”正在到來。

計算場景多樣化催生XPU

站在產業格局看,芯片廠商令人眼花繚亂的市場活動背后是它們對數據中心市場的野心,而這野心又歸結為看上計算場景的復雜多元化帶來的市場機會。

從超算系統到桌面到云到終端,都離不開各種不同類型指令集和體系架構的計算單元,如CPU、GPU、DSP、ASIC、FPGA等。由于各種不同的處理器采用不同的架構和不同指令集使得它們在處理具體計算場景是有著不同的表現,導致計算多元化的出現。

比如,GPU芯片是單指令、多數據處理,采用數量眾多的計算單元和超長的流水線,主要處理圖像領域的運算加速;FPGA適用于多指令,單數據流的分析,可提供強大的計算力和足夠的靈活性;ASIC是為實現特定場景應用要求時,而定制的專用AI芯片,在功耗、可靠性、體積方面都有優勢,尤其在低功耗的移動設備端,基于以上優勢,ASIC芯片更多的用于端或邊緣側。

其實,計算多元化是早已有之,比如x86取代IBM Power、HP PA-RISC、Sun SPARC成為數據中心霸主。但是隨著深度學習崛起,GPU受到重視,在數據中心呈現出強勁的增長趨勢。同時,Arm服務器、RISC-V的崛起,又使得數據中心開始了新的多元化進程。

芯片多元化的背后是應用場景的復雜化導致通用計算技術和通用芯片越來越不能滿足業務需求,特別是新涌現的計算場景對于計算芯片指令集、架構的要求是不一樣的,這樣就導致之前一直使用的通用CPU已經無法滿足多元化計算場景要求,這也是計算芯片的種類越來越多的重要原因,而CPU+GPU、CPU+FPGA、CPU+GPU+FPGA等組合效能更好,通用計算被迫向異構計算演進。

比如,海量數據的處理需要更高密度的計算能力,而通用計算在效能上明顯不能滿足要求。一方面,采用通用處理器需要更多處理器,成本高昂;另一方面,更多處理器帶來更高發熱,帶來了更多的制冷需求,這些最終都指向了高成本,而在某些場景下(如一些人工智能)GPU、FPG比CPU具有更高的性價比,而在一些細分的人工場景下AI專用芯片比GPU、FPG的表現還要優異,比如IPU處理稀疏矩陣的數據類型時效能就有明顯優勢。

芯片種類多的另外一個原因是芯片代工模式的普及,現在芯片設計、制造的關鍵環節都有開源開放的軟件、工具或代工企業可以利用,例如RISC-V,這也推動了更多創新廠商切入芯片領域。

騰訊云異構計算研發副總監宋吉科認為,異構計算崛起的主要原因兩個:人工智能類應用的崛起,工作負載類型多樣更加多樣化,對應芯片架構需要量身定制;從互聯網到移動互聯網,芯片產業的供應鏈也在發生變化,特別是Arm的IP設計模式,推動了臺積電等代工廠在制程工藝上的快速發展,從而各種Fabless(IC設計)芯片廠商有了更多的市場機會。

在計算產業變革的背景下,“CPU包打天下”一去不復返,異構計算即XPU的發展成為大勢所趨。我們看到眾多頭部半導體廠商推出多元化的芯片產品,不斷延展業務邊界,而創新公司也不示弱,它們在沒有歷史包袱的情況下,紛紛針對不斷涌現的業務場景推出了專屬性的芯片產品,讓整個芯片市場迎來“百家爭鳴”時刻。

x86市場的“混戰”

在當今XPU市場,通用計算芯片占據的市場份額和市場需求量是最大的,畢竟作為“全能選手”,不管是x86還是Power或者Arm,它們的計算生態也是最為成熟的,相關的技術產品也在持續迭代,上演了x86、Power、Arm通用計算市場的“三國殺”,甚至于我們如果用白熱化來形容當前的x86市場,也一點也不為過。畢竟作為最成熟的計算架構,x86伴隨著半導體產業的成長,特別是英特爾與AMD近期新品的發布更是讓x86市場平添了很多“火藥味”。

在數據中心市場,英特爾是毫無爭議的帶頭大哥,英特爾CPU在數據中心市場處于壟斷地位。據英特爾2021年第一季度業績顯示,第三代英特爾至強可擴展處理器出貨量超過20萬顆。

同時,阿里云、平安科技、騰訊云等英特爾生態伙伴已經基于第三代至強可擴展平臺開展了諸多實踐,比如在騰訊游戲的3D人臉建模中,借助第三代英特爾至強可擴展處理器的VNNI技術,可以加速4.24倍以上,這意味著原有基于3D人臉建模的各種優化、緩存、預處理環節可以直接跳過,直接提供照片就能夠生成3D模型。

在用戶端,第三代英特爾至強可擴展處理器也贏得了眾多互聯網企業的青睞,例如快手與英特爾展開合作,結合英特爾至強可擴展處理器平臺和傲騰持久內存,快手推薦系統的性能得到大幅提升,同時也能支持更多復雜算法,總擁有成本(TCO)降低了30%。

雖說英特爾至強的市場地位如此堅固,但是隨著異構計算的崛起,英特爾感受到了來自GPU、FPGA的強力挑戰。為了應對這些挑戰,近些年英特爾調整了市場戰略,不再以處理器為中心,而是以數據為中心,這體現為從CPU到XPU、從芯片(Silicon)到平臺、從傳統IDM到現代、更靈活的IDM。特別是在IDM 2.0的愿景中,英特爾在代工業務中以更加開放心態支持X86內核、ARM、RISC-V生態系統、IP的生產。

英特爾中國研究院院長宋繼強表示,異構集成是推動摩爾定律繼續發展的重要方式。英特爾轉型為包含多種計算架構XPU的公司,并在此基礎上推出了適配的軟件,并構建相應的生態,引領異構計算的發展。

如果說英特爾采取了大而全的策略,以產品組合贏得整體優勢,比如第三代英特爾至強可擴展處理器與英特爾傲騰內存存儲解決方案、英特爾以太網連接解決方案等共同組成的以數據為中心的產品組合才是英特爾的王炸,那么AMD則是重點突破,以點帶面。

雖然同為x86市場的締造者,但長期以來AMD是作為英特爾的陪襯存在,尤其是在服務器市場幾乎沒有多少存在感。AMD自然不甘心,先后發起了多次挑戰,而近幾年AMD在數據中心芯片的進步業界有目共睹。特別是第三代AMD EPYC處理器在技術領先性方面做足了文章,為行業帶來了諸多改變,比如性能、成本、生態等。

AMD總裁兼CEO蘇姿豐(Lisa Su)說,數據中心處于發展進化過程中,單一產品無法滿足數據中心的需求,AMD能夠提供具有融合、匹配數據中心需要的各種IP的能力。

自EPYC(霄龍)處理器問世以來,AMD與眾多合作伙伴展開密切合作,截止到今年,將推出超過100款服務器產品及400多個實例,幾乎涵蓋了所有的應用場景和解決方案。

例如在超算領域,AMD EPYC處理器支持的超級計算機已經在全球高性能計算TOP 500強榜單中占據多席,并為斯圖加特高性能計算中心的HLRS “HAWK”、德國天氣預報服務公司(DWD)的NEC SX-AURORA TSUBASA、蘇黎世聯邦理工學院(ETH Zurich)的ETH ZURICH EULER VI、圣地亞哥超級計算機中心(SDSC)的DELL EXPANSE、英國國家研究創新局(UKRI)的CRAY ARCHER2、法國國家高性能計算組織(GENCI)的JOLIOT-CURIE等等超算系統提供服務。

此外,AMD公司與美國橡樹嶺國家實驗室(ORNL)和Cray公司聯合打造Frontier,其基于下一代AMD EPYC霄龍處理器、Radeon Instinct加速卡、ROCm異構計算軟件三大平臺,運行峰值可達每秒1.5exaflops(百億億次),是實驗室有史以來打造的性能最強的超級計算機。

基于此,2020年Q4季度 Mercury Research的報告中AMD在服務器CPU市場份額達到了7.1%,今年Q1季度進一步增長到了8.9%。

如今芯片廠商不光在制程工藝上進行迭代,還在封裝工藝上持續創新。比如英特爾推出了EMIB技術和Foveros技術,其中EMIB是一種高密度的2D平面式封裝技術,可以將不同類型、不同工藝的芯片IP靈活地組合在一起,類似一個松散的SoC;Foveros技術首次為處理器引入了3D堆疊式設計,是大幅提升多核心、異構集成芯片的關鍵技術,可以實現芯片上堆疊芯片,而且能整合不同工藝、結構、用途的芯片。

而在Computex 2021上,AMD宣布將Chiplet封裝技術與芯片堆疊技術相結合,為未來的高性能計算產品創造出了3D Chiplet架構。這項封裝技術突破性地將AMD創新芯片架構與3D堆疊技術相結合,并采用了業界領先的混合鍵合方法,與現有的3D封裝解決方案相比,可提供超過200倍的2D芯片互連密度和15倍以上的密度。通過與臺積電(TSMC)緊密協作,與目前的3D解決方案相比,這項行業前沿的技術能耗更低,是世界上超靈活的活性硅堆疊技術。

如上所述,我們看到當前x86市場的競爭程度更加激烈,雖然市場格局沒有太大的變化,但是市場情緒也在慢慢變化。所以不管是英特爾還是AMD,唯有技術創新,匹配用戶需求,緊跟時代要求,才能在市場中立于不敗之地。

Power和Arm發起挑戰

在通用計算領域,用“傲視群雄、睥睨天下”來形容x86處理器一點兒也不過分,但這并意味著其他類型處理器就甘拜下風,比如Power和Arm就向x86處理器發起了強力挑戰,近年來不管是Power還是Arm都一直在不斷進化,為用戶提供了多樣化的選擇。

對于Power,如果是業界資深人士,一定會有一種歷史感涌上心頭。雖然被x86壓制,但是Power的生命力還是非常強大的,也在持續迭代。畢竟在存量市場上Power還是有很強的優勢,很多Power承載的都是關鍵行業的核心和關鍵業務。

實際上,Power從來就沒有甘心把霸主之位拱手相讓于x86,重新昔日榮光的夢想雖然有些遙遠,但并沒放棄。目前Power處理器已經迭代到采用7nm工藝的Power10,并廣泛應用于IBM主機產品和Power服務器產品,而在國內,浪潮商用機器作為POWER中國區獨家代言人,承擔起了重振Power雄風的重任。浪潮商用機器在不斷拓展Power架構的創新應用,讓Power在當今計算架構市場有著一席之地。

Power架構主打關鍵計算,面向關鍵應用核心云承載平臺、關鍵業務主機、云原生創新型應用。這也是其與x86區別客戶定位的重要特征。比如,浪潮K1 Power產品線就主打高可靠性、高性能、高安全和數據強實時一致性的“三高一強”特性,致力于打造關鍵應用的高可靠和高性能的安全平臺。

浪潮商用機器有限公司總經理胡雷鈞表示,作為一種縱向擴展系統,在支撐核心應用系統方面,K1 Power的性價比最高,是最可靠的技術選擇。同時,圍繞POWER處理器的國產化,浪潮商用機器提供了面向關鍵應用系統的豐富產品。

如果說Power是高大上,那么我們對Arm架構的認知則是從移動終端開始的。ARM處理器架構開啟了移動時代,而且過去五年基于Arm架構的設備出貨量超過1000億,其影響力已經遍布移動終端。但是現在Arm架構也在“出圈”,這要從Arm v9架構談起。

Arm v9架構基于Arm v8,并增添了針對矢量處理的DSP、機器學習、安全等技術特性。

眾所周知,由于高能效、低功耗等特點,Arm在移動設備和物聯網市場得到廣泛應用。其實在基礎設施領域,Arm已經耕耘超過10年,并推出了專門面向數據中心的服務器芯片架構Arm Neoverse,在HPC、云計算以及5G等市場取得了不俗的成績,不僅在AWS有Graviton以及Graviton2這樣的芯片正式投入商用,Oracle也已經宣布計劃將Ampere Altra用于其云基礎設施,而在HPC領域,不僅有世界最快超級計算機日本富士通Fugaku這樣的用戶,而且印度也宣布研發基于Neoverse的超級計算機。

憑借合作伙伴生態系統和商業模式,Arm架構已經在云、管、邊、端等場景中無處不在。新的Arm v9架構的推出也是Arm瞄準下一個計算革命的誠信之作,必將在未來多云化的計算市場闖出更為廣闊的天地。

加速計算的“黃金時代”

雖然通用計算是主流,并會在未來相當長一段時間內作為一種成熟穩定、發展緩慢的技術而存在。但是不管是GPU還是FPGA等加速芯片也正在迎來自己的黃金時代。

IDC發布的《中國半年度加速計算市場(2020下半年)跟蹤》報告顯示,2020年加速服務器市場規模達到32.0億美元,同比2019年增長52.8%。其中GPU服務器依舊占主導地位,擁有86.3%的市場份額,市場規模達到27.6億美元,同比增長37.3%。同時FPGA等非GPU加速服務器以434.0%的增速占有近15%的市場份額,市場規模達到4.4億美元。

在GPU市場,英偉達是毋庸置疑的王者,但是英偉達并沒有局限于GPU,宣布收購Arm之后,英偉達將自身的觸角伸向了CPU、DPU等XPU領域。

我們知道GPU是英偉達的“主業”,但是憑借一系列的收購,英偉達也在向其他XPU拓展,在GTC 2021大會上,英偉達推出了CPU、DPU和GPU的”組合拳“,幫助用戶打造完全可編程的單一AI計算單元。

前面我們談到在云計算、企業和邊緣數據中心、超級計算、PC等其他市場中,Arm也開始嶄露頭角。而依靠收購Arm,英偉達與Arm之間的協同有了更多想象空間,比如英偉達的DPU(Data Processing Unit,數據處理單元)就內置了Arm核心,可實現具有突破性的網絡、存儲和安全性能。

不管是CPU還是DPU、GPU,很明顯,英偉達正在將自己業務邊界不斷延展,也就是不再局限于以GPU為中心,而是以計算為核心,覆蓋多樣化的計算工作負載。隨之而來的就是客戶選擇的靈活性,同時整個計算芯片市場也將迎來新的格局。

在加速計算市場,靈活的FPGA已然異軍突起。例如微軟通過英特爾FPGA加速Azure云服務、必應和其它數據中心服務中的實時人工智能、網絡及其它應用或基礎設施。

雖然國際國內市場的FPGA廠商挺多,但是FPGA市場的主要玩家便是英特爾與賽靈思,而在AMD在宣布收購賽靈思之后,FPGA市場之間的格局更具看點。

英特爾和賽靈思對于FPGA市場是兩種不同的技術路線,這很大程度是取決于他們背后的技術儲備和對于FPGA的定位。對于英特爾而言,它旗下有CPU、GPU、Movidius VPU、FPGA等多種面向不同場景的計算平臺。所以在英特爾這里,“FPGA就是FPGA”,只不過是一種實現AI算法的途徑而已。而在Xilinx這里,FPGA就是它的全部。為了適應更大的市場,Xilinx需要“FPGA不止是FPGA”。所以就誕生了ACAP這樣“超越了FPGA”的新型器件。

除了技術產品策略,英特爾和賽靈思之間的競爭因為AMD對賽靈思的收購有了更多故事可講。這應該是AMD是對英特爾收購Altera的應對,不過對應AMD而言,這可以豐富自身產品線和強化競爭力,還有對FPGA芯片與CPU、GPU的技術融合嘗試探索以及未來市場的先行布局。

從加速計算市場我們可以看到加速計算其實與通用計算市場有著千絲萬縷的聯系,也就是CPU、GPU、FPGA之家具備內在聯系,半導體廠商在產品布局方面是將這三者放到一起的,從而更好地為用戶提供充沛的算力。

專用芯片的“爭奇斗艷”

AI芯片市場隨人工智能發展持續火爆,根據Gartner的測算和預測,預計2023年全球AI芯片市場規模將達到343億美元。

雖然目前通用計算芯片和GPU加速芯片是主流,但是DPU、VPU、TPU、IPU以及各種專用芯片也在迅速崛起,面向特定應用搶占細分市場。

在諸多“PU”中,DPU是最受關注的芯片類型之一,一方面是因為DPU巨大的市場前景,另一方面是因為有英偉達、英特爾這樣的巨頭參與。可以預見,未來DPU的應用將越來越廣泛。業內人士甚至樂觀地估計,DPU可能會成為CPU、GPU之外的第三個熱點。

簡單地說,CPU相當于一個通才,它長處是什么都能干,但效率不高,而GPU、DPU相當于專才,專門干一件或者一類事情,因此效率最高。對CPU、GPU和DPU的區別,DPU初創公司中科馭數創始人兼CEO鄢貴海有個形象的比喻:如果把一臺計算機或服務器比作一個團隊,CPU相當于這個團隊的“大管家”,負責思考并處理各種業務;GPU是“美工”,專攻圖像處理;DPU則相當于“前臺”,負責打包、拆包“數據包”,提升整個團隊的工作效率。

中科馭數2018年成立,今年中科馭數發布了其下一代DPU芯片計劃,將基于自研的KPU(Kernel Processing Unit)芯片架構,圍繞網絡協議處理、數據庫和大數據處理加速、存儲運算、安全加密運算等核心功能,推出新一代DPU芯片。

目前中科馭數提供網絡、數據庫、風控等硬件加速解決方案,與上交所、金證股份、360數科等金融行業客戶一起加速DPU的應用落地,算力的靈活組合滿足金融用戶的定制化需求。

例如金證股份已有的行情系統在交易繁忙階段(如開盤等情況),系統延遲達到51us,而且抖動非常大。而在應用基于中科馭數KPU架構的極速行情系統后,系統延遲降低一個數量級,并且系統都能保持在20ns以下,為交易客戶提供了先機。

所謂“英雄所見略同”,星云智聯CEO于勇認為,未來的數據中心將不再以通用CPU為核心,而是解構成GPCPU、GPU、TPU、FPGA、DSP等異構算力資源池,以及SSD和磁盤等存儲資源池。“未來十年,全球云計算和數據中心基礎架構將迎來顛覆性變革,基于DPU的統一通信服務平臺(CAAS)是未來架構的核心引擎。”

除了DPU,現在業界的另外一個熱詞就是IPU,就在近日,英特爾推出XPU產品的最新成員——基礎設施處理器(IPU),具體來說,IPU是一種可編程網絡設備,擴展了智能網卡功能,這有點類似NVIDIA的DPU。

不過業界對于IPU的定義也不盡相同,Graphcore的IPU是指Intelligence Processing Unit,智能處理器。在Graphcore高級副總裁兼中國區總經理盧濤看來,CPU和GPU都不是專門為AI而設計。而IPU是專為AI應用設計,其強大的并行處理能力確保了快速訓練模型的實現,并能進行實時操控。

當計算系統變得更加專用化之后,分層就會顯現,異構的進程就會加快。隨著工作負載類型的細分以及半導體產業鏈的變化,未來新型專用加速器會越來越多,以更好地滿足不同場景的需求。

國產芯片的“彎道超車”

在當前計算產業面臨變革之際,我們看到中國廠商的機會也在出現。在新環境和新技術驅動下,國產CPU正處于奮力追趕的關鍵時期,以飛騰、鯤鵬、海光、龍芯、兆芯、申威等為代表的廠商正全力打造“中國芯”。

以華為為例,其聚焦鯤鵬和昇騰,構建全場景多樣性智能計算平臺。自2019年華為發布計算戰略以來,鯤鵬計算產業生態蓬勃發展,不僅構建了完整的生態體系,并且鯤鵬行業解決方案已在國計民生行業核心系統獲得了規模化應用。

鯤鵬計算產業的能力輸出,離不開其“硬件開放、軟件開源、使能合作伙伴”的技術生態戰略。基于鯤鵬生態,各行各業可快速上手基于華為鯤鵬和昇騰處理器的IT基礎設施及行業應用,包括PC、服務器、存儲、操作系統、中間件、虛擬化、數據庫、云服務及行業應用等,在大數據與人工智能場景,發揮其架構優勢,釋放多元算力。

到目前為止全國已落地24家生態創新中心、12家OEM整機伙伴、2700多家合作伙伴、5700多個解決方案認證、40萬鯤鵬開發者,在各行業中已有成熟應用案例,包括電信、互聯網、安平、能源、金融、交通、制造、政務等。

目前在國際環境、產業政策、市場需求的聯合驅動下,一大批國產CPU廠商奮楫前行,在工藝、性能、生態建設等多個方面不斷取得突破,產業布局、資金投入、技術研發、人才培養等各個方面都在快速進步。

未來會有更多的中國優秀芯片企業涌現出來,國產芯片的水平也一定會彎道超車。我們在全球芯片產業鏈上的話語權,也一定會越來越大!

面向未來的前沿計算

既要腳踏實地,又要仰望星空。如果說前面說到的各種XPU已經近在眼前,那么英特爾和IBM在神經擬態計算(類腦計算)和量子計算的前沿研究給予我們的可能是希望,它們帶來的前所未有的創新成果,為計算的未來帶來了新的想象空間。

神經擬態計算模擬的是大腦的計算模式,包含很多并行計算和異步計算,不需要提前進行數據訓練,可以在工作的過程中自我進行學習,大幅提升效率和能耗。

英特爾已經推出由768個Loihi組成的神經擬態計算系統Pohoiki Spring,擁有1億個神經元,并成立了神經擬態計算社區,推動神經擬態計算落地。

量子計算已經成為全球科技領域關注的焦點,英特爾推出了代號為“Horse Ridge”的低溫控制芯片,實現了對多個量子位的控制,可以實現更大的量子系統擴展。

除了英特爾,我們看到IBM在量子計算領域也在積極布局——2016 年,開放量子云平臺,接入5比特的量子芯片Canary ;2019 年,IBM實現了27個比特的量子芯片Falcon;前不久,IBM 向其IBM Q Network成員發布了65個比特的量子處理器Hummingbird。

從2000年起,IBM開始探索超導量子位這一技術路線,2021年,IBM將突破100比特的關卡,推出127比特的Eagle處理器。在Eagle處理器上,IBM引入并發實時經典計算能力,這將允許執行更廣泛的量子電路和代碼。

除了量子計算,IBM近日發布了全球首個2納米芯片制造技術,再次引領了半導體行業的潮流。

在英特爾、IBM等均先后投入量子運算領域發展, NVIDIA在GTC 2021也宣布推出名為cuQuantum的開發工具組,讓開發者能透過此開發工具組配合NVIDIA GPU進行量子運算特性模擬加速。

困境與挑戰

展望未來,隨著XPU戰略的推進,各大半導體廠商以自身優勢產品為依托,不斷探索算力的跨界融合,這一趨勢也將延續下來。

不過,芯片架構五花八門,指令集不同,無法兼容,而面向芯片的編程庫又跟芯片綁定,靈活性差。小公司只做了其中一個環節,這造成生態的縱向不通;大公司希望構建封閉的系統,這造成了生態的橫向不通。

芯片從制造出來到大規模用起來,往往還隔著一個巨大的生態鴻溝。芯片應用一般都面臨著開發者學習成本高、用戶應用遷移困難、芯片制造公司難以上規模的困難和挑戰。

在有些芯片造出來后,面向開發者的幫助文檔、調試工具或者交流問答社區建設不足,導致開發者學習時間長,難度大,如果學習多個芯片,難度更大,開發者的學習積極性下降。而對于芯片的最終使用者來說,由于芯片指令集或芯片架構的差異,導致編程庫、編程模型、算法框架無法有效的橫向拉通,致使大量的應用遷移困難,可能只是1%的小小的依賴,就會導致適配工作前功盡棄,進一步帶來計算的復雜性。

而芯片供應商如果想解決開發者的問題、想解決使用者的問題,則往往需要投入比芯片研發成本高數十倍的推廣費用。

不管是英特爾還是英偉達,他們的硬件產品只是一方面,他們也在將自身定位一家軟件公司。例如英特爾內部有超過1萬人在圍繞芯片的配套支撐、應用適配、優化調優做工作。英偉達提供一系列基于NVIDIA AI以及用于仿真、協作和自主機器訓練的軟件,尤其是公司的CUDA軟件環境更是通過長期的大規模投入,才打造了其GPU在HPC和AI方面的領先地位。

軟件是釋放異構計算性能的重要一環。英特爾一直也在FPGA、ASIC、GPU和CPU的多種算力產品XPU基礎上開發適配的軟件,推出了開源的跨架構開發模型oneAPI。

軟件開發人員可以使用oneAPI開放式跨架構編程來優化其應用程序,從而避免了專有模型的技術和經濟負擔。英特爾oneAPI工具包通過高級編譯器、庫以及分析和調試工具幫助實現處理器的卓越性能、人工智能和加密功能。

英特爾架構、圖形和軟件集團副總裁兼中國區總經理謝曉清表示,英特爾的戰略是希望能夠把IA生態系統的開發者最大限度地無縫鏈接到oneAPI所支持的異構計算領域,為英特爾的XPU戰略打下一個堅實的軟件基礎。

其實,AMD在異構計算整合方面也早有布局,并選擇了四步走的持續性戰略,其中第四步是架構和系統整合,從硬件到軟件完全實現異構計算支持。

2012年,AMD成立了一個HSA(異構系統架構)基金會,拉了ARM、Imagination、聯發科、德州儀器、三星等眾多一線大廠一同上陣,主推一個叫做OpenCL的異構編程框架。

2015年,AMD宣布名為“Boltzmann計劃”的新款開發工具套件,協助用戶更簡單地開發兼具高性能與低耗能的異構計算系統。“Boltzmann計劃”利用HSA架構優勢,發揮CPU與AMD FirePro GPU計算資源,通過軟件同時釋放極致計算效率。

綜上所述,XPU不能僅僅是XPU,它不是硬件簡單的物理堆砌,而要考慮到其中的互聯互通,跨架構的軟件協同,只有軟硬件協同發展,才能更好的發揮出產品應有的價值。

誰“朋友圈”大

“單兵作戰”的效果往往不如“軍團作戰”,其中的奧秘就是“協同作用”。舉例來說,飛機作戰,如果只是轟炸機單兵作戰,雖然攻擊性很強,卻缺乏保護體系,需戰斗機協同作戰,以保護轟炸機的安全。

產品組合以及解決方案才是芯片廠商競爭力的重要表現,這一方面是廠商自身的豐富產品組合,例如XPU便是重要策略。另一方面,芯片廠商的生態建設,積極擴大“朋友圈”。如果產品是一家企業的根本,那么生態活動則是“眾人拾柴火焰高”。

英特爾公司副總裁兼至強處理器與存儲事業部總經理Lisa Spelman表示,對于英特爾來說,提供滿足客戶需求的產品組合,這是非常巨大的差異化的競爭優勢,這是英特爾數據中心戰略的核心。

“我們的關注點是通過產品組合傳遞客戶價值。我們現在要將產品提升到系統層面的解決方案。英特爾新增加的產品和解決方案都是作為整個平臺的延續給客戶提供價值和解決問題。”Lisa Spelman說。

為了讓產品方案化,英特爾還推出了英特爾精選解決方案和英特爾市場就緒解決方案,幫助客戶加速云、人工智能、企業端、高性能計算、網絡、安全和邊緣應用上的部署。其中近80%的英特爾精選解決方案將在今年年底前完成更新為搭載第三代英特爾至強可擴展處理器。

其實不光英特爾,我們看到不管是Arm還是英偉達等廠商,都在積極構建生態圈。例如Arm生態系統在移動和嵌入式方面一直很強大。從Arm架構發展歷程來看,通過社區建設增強用戶認知度,打造成熟的生態系統是其取得成功的關鍵因素。

同時,Arm借助v9的推出也在向其他計算領域延展。通過將全面計算的設計原則應用在包含汽車、客戶端、基礎設施和物聯網解決方案的整個IP組合中,Arm v9系統級技術將遍及整個IP解決方案,并改善個別IP。

英偉達也一樣,其也在積極發展軟硬件一體化的組合,并借助合作伙伴生態系統在HPC和AI等領域拓展更為廣闊的空間。例如借助英偉達企業合作伙伴計劃(NPN),英偉達在全球范圍內擁有超1500名合作伙伴,提供加速網絡、分解式網絡以及軟件定義的網絡,以滿足 AI、云和高性能計算快速增長的需求。

總之,借助生態系統將自身的XPU產品組合以及與合作伙伴聯合打造的解決方案觸達用戶是半導體廠商贏得市場的關鍵。

結語

數字時代對計算力提出了前所未有的要求,算力將成為新的生產力。

這反映到產業層面,眾多芯片廠商競相切入XPU的賽道。展望未來,通用計算市場穩中求變,不管是x86、Power、Arm等在保持既有技術優勢的同時,也在不斷適配和拓展新的應用場景。

對于GPU、FPGA等加速計算芯片市場,隨著AI類工作負載成為主流,他們的發展空間巨大,但是這些加速芯片需要與通用計算芯片協同工作才能更好地發揮其自身價值,這也預示著類似英特爾、AMD、英偉達、Arm等廠商會在通用計算和加速計算兩個市場展開積極布局。

對于ASIC專用芯片市場,雖然這是一個相當長尾的市場,但是該市場的創新活躍度是最高的,成為眾多創新創業公司的目標領域。雖然他們現在還不是市場主流,但是在滿足客戶定制化的需求方面,ASIC芯片的重要性是不言而喻。

國產芯片的發展任重道遠,但是在外部環境和國家政策的驅動下,國產芯片的被重視程度會越來越高,但是國產半導體芯片廠商的成長之路注定是不平坦的。

雖然神經擬態計算(類腦計算)和量子計算還處于研究探索階段,但是其展示了未來的無限可能。隨著相應研究投入的持續增加,相關應用也會涌現,這點也值得我們持續關注。

在全景展現XPU產業之際,我們也看到芯片廠商需要在軟硬件協同、生態構建等方面還有巨大的改善空間,他們需要傾聽客戶和用戶的聲音,通過需求驅動產品和技術的發展。

站在數字經濟發展的新階段,算力的價值日漸凸顯。隨著大數據、人工智能、邊緣計算等技術的發展,計算架構的“新黃金十年”已經開啟,計算產業正在迎來新的發展機遇。

展望未來,XPU市場將呈現百花齊放的局面,各種芯片在各自的賽道發揮自身獨特的價值。同時各種計算架構之間在聚焦自身優勢的同時,也在相互融合協同,形成了“你中有我,我中有你”的局面。

關鍵字:芯片產業格局FPGACPU

本文摘自:至頂網

x CPU、GPU、FPGA、AI芯片,各種XPU哪家強?一篇文章看懂芯片產業格局 掃一掃
分享本文到朋友圈
當前位置:新聞中心行業相關 → 正文

CPU、GPU、FPGA、AI芯片,各種XPU哪家強?一篇文章看懂芯片產業格局

責任編輯:yang |來源:企業網D1Net  2021-07-14 15:01:17 本文摘自:至頂網

展望未來,XPU市場將呈現百花齊放的局面,各種芯片在各自的賽道發揮自身獨特的價值。同時各種計算架構之間在聚焦自身優勢的同時,也在相互融合協同,形成了“你中有我,我中有你”的局面。

2021年開年雖然業界面臨“缺芯”問題,但是眾多半導體廠商的新品發布卻是此起彼伏,“你方唱罷我登場”。

……

GTC 2021上,英偉達宣布進軍CPU,實現CPU、GPU、DPU“3U一體”

英特爾發布用于數據中心的第三代至強可擴展處理器Ice Lake以及其產品組合

AMD EPYC進化到代號“米蘭”的第三代

Arm 發布最新一代架構Arm v9,更早些時候Arm推出了面向數據中心的Neoverse平臺

……

一時間,原本涇渭分明的數據中心芯片市場變得錯綜復雜,XPU(CPU、GPU、DPU等各種服務器處理器的統稱)成為半導體芯片廠商競爭的新賽道,一條清晰的競爭主線也逐漸明顯——各大芯片企業都在構建自己的多元化產品能力。

半導體巨頭們圍繞XPU展開了積極布局的同時,在市場驅動下,各個細分領域的XPU廠商也紛紛發力,APU、TPU、IPU等各種加速芯片百花齊放,地平線、寒武紀、中科馭數等廠商涌現。特別是在外部斷供以及國產化趨勢下,國產廠商也迎來發展契機,比如龍芯、飛騰、鯤鵬等在積極構建產品與技術生態。

算力就是生產力

面對層出不窮的XPU,站在更為宏觀的視角看,這已經不簡單只是廠商之間的技術、產品、市場之爭,其背后代表了一種對先進生產力之間的追逐。

人類社會每一次科技躍遷,其本質都是計算力的突破與進化,每一次新文明的進階,都是計算方式和載體變遷帶來社會效率提升的結果。如果說在工業時代電力是基礎設施,是經濟社會發展的動力保障,那么,隨著人類社會邁入數字經濟時代,算力正在扮演相似角色。

根據中國信息通信研究院今年發布的《中國數字經濟白皮書》,2020年中國數字經濟規模達到39.2萬億元人民幣,占GDP比重為38.6%。數字經濟的基礎是對數據進行處理,也就是利用大大小小各種規模的數據中心——從幾十臺服務器的小規模數據中心到幾十萬到上百萬臺規模的超大型數據中心提供的算力,運行各種軟件來提供各種服務以支撐企業的生產經營和消費者的各種消費服務。由于計算力的大小代表了對數據處理能力的強弱,因此,計算力自然成為數字經濟的核心要素,是核心生產力。

IDC發布的《2020全球計算力指數評估報告》也表明,計算力與經濟增長緊密相關,計算力指數平均每提高1個點,數字經濟和GDP將分別增長3.3‰和1.8‰。

當前,各個國家的數字經濟占比將持續提升,而數字經濟和算力需求處于循環增強的狀態,同時,新興技術的投入與算力投入相關性極高,算力為新興技術應用提供基礎保障,新興技術的發展進一步推動算力提升,其中物聯網、人工智能和大數據的相關性最為顯著,新興技術和算力呈現相互拉動效應。

正是看到了算力在數字經濟發展中的重要作用,全國一體化算力網絡國家樞紐節點建設也于近期正式啟動,其將成為中國數字經濟發展的新基座。

總之,算力不僅僅是一個技術指標,而是先進生產力的代表。未來,算力與數字經濟共促共進的關系將進一步強化:即算力不斷發展推動數字經濟持續向前,數字經濟持續向前加重對算力的支撐依賴,“算力經濟時代”正在到來。

計算場景多樣化催生XPU

站在產業格局看,芯片廠商令人眼花繚亂的市場活動背后是它們對數據中心市場的野心,而這野心又歸結為看上計算場景的復雜多元化帶來的市場機會。

從超算系統到桌面到云到終端,都離不開各種不同類型指令集和體系架構的計算單元,如CPU、GPU、DSP、ASIC、FPGA等。由于各種不同的處理器采用不同的架構和不同指令集使得它們在處理具體計算場景是有著不同的表現,導致計算多元化的出現。

比如,GPU芯片是單指令、多數據處理,采用數量眾多的計算單元和超長的流水線,主要處理圖像領域的運算加速;FPGA適用于多指令,單數據流的分析,可提供強大的計算力和足夠的靈活性;ASIC是為實現特定場景應用要求時,而定制的專用AI芯片,在功耗、可靠性、體積方面都有優勢,尤其在低功耗的移動設備端,基于以上優勢,ASIC芯片更多的用于端或邊緣側。

其實,計算多元化是早已有之,比如x86取代IBM Power、HP PA-RISC、Sun SPARC成為數據中心霸主。但是隨著深度學習崛起,GPU受到重視,在數據中心呈現出強勁的增長趨勢。同時,Arm服務器、RISC-V的崛起,又使得數據中心開始了新的多元化進程。

芯片多元化的背后是應用場景的復雜化導致通用計算技術和通用芯片越來越不能滿足業務需求,特別是新涌現的計算場景對于計算芯片指令集、架構的要求是不一樣的,這樣就導致之前一直使用的通用CPU已經無法滿足多元化計算場景要求,這也是計算芯片的種類越來越多的重要原因,而CPU+GPU、CPU+FPGA、CPU+GPU+FPGA等組合效能更好,通用計算被迫向異構計算演進。

比如,海量數據的處理需要更高密度的計算能力,而通用計算在效能上明顯不能滿足要求。一方面,采用通用處理器需要更多處理器,成本高昂;另一方面,更多處理器帶來更高發熱,帶來了更多的制冷需求,這些最終都指向了高成本,而在某些場景下(如一些人工智能)GPU、FPG比CPU具有更高的性價比,而在一些細分的人工場景下AI專用芯片比GPU、FPG的表現還要優異,比如IPU處理稀疏矩陣的數據類型時效能就有明顯優勢。

芯片種類多的另外一個原因是芯片代工模式的普及,現在芯片設計、制造的關鍵環節都有開源開放的軟件、工具或代工企業可以利用,例如RISC-V,這也推動了更多創新廠商切入芯片領域。

騰訊云異構計算研發副總監宋吉科認為,異構計算崛起的主要原因兩個:人工智能類應用的崛起,工作負載類型多樣更加多樣化,對應芯片架構需要量身定制;從互聯網到移動互聯網,芯片產業的供應鏈也在發生變化,特別是Arm的IP設計模式,推動了臺積電等代工廠在制程工藝上的快速發展,從而各種Fabless(IC設計)芯片廠商有了更多的市場機會。

在計算產業變革的背景下,“CPU包打天下”一去不復返,異構計算即XPU的發展成為大勢所趨。我們看到眾多頭部半導體廠商推出多元化的芯片產品,不斷延展業務邊界,而創新公司也不示弱,它們在沒有歷史包袱的情況下,紛紛針對不斷涌現的業務場景推出了專屬性的芯片產品,讓整個芯片市場迎來“百家爭鳴”時刻。

x86市場的“混戰”

在當今XPU市場,通用計算芯片占據的市場份額和市場需求量是最大的,畢竟作為“全能選手”,不管是x86還是Power或者Arm,它們的計算生態也是最為成熟的,相關的技術產品也在持續迭代,上演了x86、Power、Arm通用計算市場的“三國殺”,甚至于我們如果用白熱化來形容當前的x86市場,也一點也不為過。畢竟作為最成熟的計算架構,x86伴隨著半導體產業的成長,特別是英特爾與AMD近期新品的發布更是讓x86市場平添了很多“火藥味”。

在數據中心市場,英特爾是毫無爭議的帶頭大哥,英特爾CPU在數據中心市場處于壟斷地位。據英特爾2021年第一季度業績顯示,第三代英特爾至強可擴展處理器出貨量超過20萬顆。

同時,阿里云、平安科技、騰訊云等英特爾生態伙伴已經基于第三代至強可擴展平臺開展了諸多實踐,比如在騰訊游戲的3D人臉建模中,借助第三代英特爾至強可擴展處理器的VNNI技術,可以加速4.24倍以上,這意味著原有基于3D人臉建模的各種優化、緩存、預處理環節可以直接跳過,直接提供照片就能夠生成3D模型。

在用戶端,第三代英特爾至強可擴展處理器也贏得了眾多互聯網企業的青睞,例如快手與英特爾展開合作,結合英特爾至強可擴展處理器平臺和傲騰持久內存,快手推薦系統的性能得到大幅提升,同時也能支持更多復雜算法,總擁有成本(TCO)降低了30%。

雖說英特爾至強的市場地位如此堅固,但是隨著異構計算的崛起,英特爾感受到了來自GPU、FPGA的強力挑戰。為了應對這些挑戰,近些年英特爾調整了市場戰略,不再以處理器為中心,而是以數據為中心,這體現為從CPU到XPU、從芯片(Silicon)到平臺、從傳統IDM到現代、更靈活的IDM。特別是在IDM 2.0的愿景中,英特爾在代工業務中以更加開放心態支持X86內核、ARM、RISC-V生態系統、IP的生產。

英特爾中國研究院院長宋繼強表示,異構集成是推動摩爾定律繼續發展的重要方式。英特爾轉型為包含多種計算架構XPU的公司,并在此基礎上推出了適配的軟件,并構建相應的生態,引領異構計算的發展。

如果說英特爾采取了大而全的策略,以產品組合贏得整體優勢,比如第三代英特爾至強可擴展處理器與英特爾傲騰內存存儲解決方案、英特爾以太網連接解決方案等共同組成的以數據為中心的產品組合才是英特爾的王炸,那么AMD則是重點突破,以點帶面。

雖然同為x86市場的締造者,但長期以來AMD是作為英特爾的陪襯存在,尤其是在服務器市場幾乎沒有多少存在感。AMD自然不甘心,先后發起了多次挑戰,而近幾年AMD在數據中心芯片的進步業界有目共睹。特別是第三代AMD EPYC處理器在技術領先性方面做足了文章,為行業帶來了諸多改變,比如性能、成本、生態等。

AMD總裁兼CEO蘇姿豐(Lisa Su)說,數據中心處于發展進化過程中,單一產品無法滿足數據中心的需求,AMD能夠提供具有融合、匹配數據中心需要的各種IP的能力。

自EPYC(霄龍)處理器問世以來,AMD與眾多合作伙伴展開密切合作,截止到今年,將推出超過100款服務器產品及400多個實例,幾乎涵蓋了所有的應用場景和解決方案。

例如在超算領域,AMD EPYC處理器支持的超級計算機已經在全球高性能計算TOP 500強榜單中占據多席,并為斯圖加特高性能計算中心的HLRS “HAWK”、德國天氣預報服務公司(DWD)的NEC SX-AURORA TSUBASA、蘇黎世聯邦理工學院(ETH Zurich)的ETH ZURICH EULER VI、圣地亞哥超級計算機中心(SDSC)的DELL EXPANSE、英國國家研究創新局(UKRI)的CRAY ARCHER2、法國國家高性能計算組織(GENCI)的JOLIOT-CURIE等等超算系統提供服務。

此外,AMD公司與美國橡樹嶺國家實驗室(ORNL)和Cray公司聯合打造Frontier,其基于下一代AMD EPYC霄龍處理器、Radeon Instinct加速卡、ROCm異構計算軟件三大平臺,運行峰值可達每秒1.5exaflops(百億億次),是實驗室有史以來打造的性能最強的超級計算機。

基于此,2020年Q4季度 Mercury Research的報告中AMD在服務器CPU市場份額達到了7.1%,今年Q1季度進一步增長到了8.9%。

如今芯片廠商不光在制程工藝上進行迭代,還在封裝工藝上持續創新。比如英特爾推出了EMIB技術和Foveros技術,其中EMIB是一種高密度的2D平面式封裝技術,可以將不同類型、不同工藝的芯片IP靈活地組合在一起,類似一個松散的SoC;Foveros技術首次為處理器引入了3D堆疊式設計,是大幅提升多核心、異構集成芯片的關鍵技術,可以實現芯片上堆疊芯片,而且能整合不同工藝、結構、用途的芯片。

而在Computex 2021上,AMD宣布將Chiplet封裝技術與芯片堆疊技術相結合,為未來的高性能計算產品創造出了3D Chiplet架構。這項封裝技術突破性地將AMD創新芯片架構與3D堆疊技術相結合,并采用了業界領先的混合鍵合方法,與現有的3D封裝解決方案相比,可提供超過200倍的2D芯片互連密度和15倍以上的密度。通過與臺積電(TSMC)緊密協作,與目前的3D解決方案相比,這項行業前沿的技術能耗更低,是世界上超靈活的活性硅堆疊技術。

如上所述,我們看到當前x86市場的競爭程度更加激烈,雖然市場格局沒有太大的變化,但是市場情緒也在慢慢變化。所以不管是英特爾還是AMD,唯有技術創新,匹配用戶需求,緊跟時代要求,才能在市場中立于不敗之地。

Power和Arm發起挑戰

在通用計算領域,用“傲視群雄、睥睨天下”來形容x86處理器一點兒也不過分,但這并意味著其他類型處理器就甘拜下風,比如Power和Arm就向x86處理器發起了強力挑戰,近年來不管是Power還是Arm都一直在不斷進化,為用戶提供了多樣化的選擇。

對于Power,如果是業界資深人士,一定會有一種歷史感涌上心頭。雖然被x86壓制,但是Power的生命力還是非常強大的,也在持續迭代。畢竟在存量市場上Power還是有很強的優勢,很多Power承載的都是關鍵行業的核心和關鍵業務。

實際上,Power從來就沒有甘心把霸主之位拱手相讓于x86,重新昔日榮光的夢想雖然有些遙遠,但并沒放棄。目前Power處理器已經迭代到采用7nm工藝的Power10,并廣泛應用于IBM主機產品和Power服務器產品,而在國內,浪潮商用機器作為POWER中國區獨家代言人,承擔起了重振Power雄風的重任。浪潮商用機器在不斷拓展Power架構的創新應用,讓Power在當今計算架構市場有著一席之地。

Power架構主打關鍵計算,面向關鍵應用核心云承載平臺、關鍵業務主機、云原生創新型應用。這也是其與x86區別客戶定位的重要特征。比如,浪潮K1 Power產品線就主打高可靠性、高性能、高安全和數據強實時一致性的“三高一強”特性,致力于打造關鍵應用的高可靠和高性能的安全平臺。

浪潮商用機器有限公司總經理胡雷鈞表示,作為一種縱向擴展系統,在支撐核心應用系統方面,K1 Power的性價比最高,是最可靠的技術選擇。同時,圍繞POWER處理器的國產化,浪潮商用機器提供了面向關鍵應用系統的豐富產品。

如果說Power是高大上,那么我們對Arm架構的認知則是從移動終端開始的。ARM處理器架構開啟了移動時代,而且過去五年基于Arm架構的設備出貨量超過1000億,其影響力已經遍布移動終端。但是現在Arm架構也在“出圈”,這要從Arm v9架構談起。

Arm v9架構基于Arm v8,并增添了針對矢量處理的DSP、機器學習、安全等技術特性。

眾所周知,由于高能效、低功耗等特點,Arm在移動設備和物聯網市場得到廣泛應用。其實在基礎設施領域,Arm已經耕耘超過10年,并推出了專門面向數據中心的服務器芯片架構Arm Neoverse,在HPC、云計算以及5G等市場取得了不俗的成績,不僅在AWS有Graviton以及Graviton2這樣的芯片正式投入商用,Oracle也已經宣布計劃將Ampere Altra用于其云基礎設施,而在HPC領域,不僅有世界最快超級計算機日本富士通Fugaku這樣的用戶,而且印度也宣布研發基于Neoverse的超級計算機。

憑借合作伙伴生態系統和商業模式,Arm架構已經在云、管、邊、端等場景中無處不在。新的Arm v9架構的推出也是Arm瞄準下一個計算革命的誠信之作,必將在未來多云化的計算市場闖出更為廣闊的天地。

加速計算的“黃金時代”

雖然通用計算是主流,并會在未來相當長一段時間內作為一種成熟穩定、發展緩慢的技術而存在。但是不管是GPU還是FPGA等加速芯片也正在迎來自己的黃金時代。

IDC發布的《中國半年度加速計算市場(2020下半年)跟蹤》報告顯示,2020年加速服務器市場規模達到32.0億美元,同比2019年增長52.8%。其中GPU服務器依舊占主導地位,擁有86.3%的市場份額,市場規模達到27.6億美元,同比增長37.3%。同時FPGA等非GPU加速服務器以434.0%的增速占有近15%的市場份額,市場規模達到4.4億美元。

在GPU市場,英偉達是毋庸置疑的王者,但是英偉達并沒有局限于GPU,宣布收購Arm之后,英偉達將自身的觸角伸向了CPU、DPU等XPU領域。

我們知道GPU是英偉達的“主業”,但是憑借一系列的收購,英偉達也在向其他XPU拓展,在GTC 2021大會上,英偉達推出了CPU、DPU和GPU的”組合拳“,幫助用戶打造完全可編程的單一AI計算單元。

前面我們談到在云計算、企業和邊緣數據中心、超級計算、PC等其他市場中,Arm也開始嶄露頭角。而依靠收購Arm,英偉達與Arm之間的協同有了更多想象空間,比如英偉達的DPU(Data Processing Unit,數據處理單元)就內置了Arm核心,可實現具有突破性的網絡、存儲和安全性能。

不管是CPU還是DPU、GPU,很明顯,英偉達正在將自己業務邊界不斷延展,也就是不再局限于以GPU為中心,而是以計算為核心,覆蓋多樣化的計算工作負載。隨之而來的就是客戶選擇的靈活性,同時整個計算芯片市場也將迎來新的格局。

在加速計算市場,靈活的FPGA已然異軍突起。例如微軟通過英特爾FPGA加速Azure云服務、必應和其它數據中心服務中的實時人工智能、網絡及其它應用或基礎設施。

雖然國際國內市場的FPGA廠商挺多,但是FPGA市場的主要玩家便是英特爾與賽靈思,而在AMD在宣布收購賽靈思之后,FPGA市場之間的格局更具看點。

英特爾和賽靈思對于FPGA市場是兩種不同的技術路線,這很大程度是取決于他們背后的技術儲備和對于FPGA的定位。對于英特爾而言,它旗下有CPU、GPU、Movidius VPU、FPGA等多種面向不同場景的計算平臺。所以在英特爾這里,“FPGA就是FPGA”,只不過是一種實現AI算法的途徑而已。而在Xilinx這里,FPGA就是它的全部。為了適應更大的市場,Xilinx需要“FPGA不止是FPGA”。所以就誕生了ACAP這樣“超越了FPGA”的新型器件。

除了技術產品策略,英特爾和賽靈思之間的競爭因為AMD對賽靈思的收購有了更多故事可講。這應該是AMD是對英特爾收購Altera的應對,不過對應AMD而言,這可以豐富自身產品線和強化競爭力,還有對FPGA芯片與CPU、GPU的技術融合嘗試探索以及未來市場的先行布局。

從加速計算市場我們可以看到加速計算其實與通用計算市場有著千絲萬縷的聯系,也就是CPU、GPU、FPGA之家具備內在聯系,半導體廠商在產品布局方面是將這三者放到一起的,從而更好地為用戶提供充沛的算力。

專用芯片的“爭奇斗艷”

AI芯片市場隨人工智能發展持續火爆,根據Gartner的測算和預測,預計2023年全球AI芯片市場規模將達到343億美元。

雖然目前通用計算芯片和GPU加速芯片是主流,但是DPU、VPU、TPU、IPU以及各種專用芯片也在迅速崛起,面向特定應用搶占細分市場。

在諸多“PU”中,DPU是最受關注的芯片類型之一,一方面是因為DPU巨大的市場前景,另一方面是因為有英偉達、英特爾這樣的巨頭參與。可以預見,未來DPU的應用將越來越廣泛。業內人士甚至樂觀地估計,DPU可能會成為CPU、GPU之外的第三個熱點。

簡單地說,CPU相當于一個通才,它長處是什么都能干,但效率不高,而GPU、DPU相當于專才,專門干一件或者一類事情,因此效率最高。對CPU、GPU和DPU的區別,DPU初創公司中科馭數創始人兼CEO鄢貴海有個形象的比喻:如果把一臺計算機或服務器比作一個團隊,CPU相當于這個團隊的“大管家”,負責思考并處理各種業務;GPU是“美工”,專攻圖像處理;DPU則相當于“前臺”,負責打包、拆包“數據包”,提升整個團隊的工作效率。

中科馭數2018年成立,今年中科馭數發布了其下一代DPU芯片計劃,將基于自研的KPU(Kernel Processing Unit)芯片架構,圍繞網絡協議處理、數據庫和大數據處理加速、存儲運算、安全加密運算等核心功能,推出新一代DPU芯片。

目前中科馭數提供網絡、數據庫、風控等硬件加速解決方案,與上交所、金證股份、360數科等金融行業客戶一起加速DPU的應用落地,算力的靈活組合滿足金融用戶的定制化需求。

例如金證股份已有的行情系統在交易繁忙階段(如開盤等情況),系統延遲達到51us,而且抖動非常大。而在應用基于中科馭數KPU架構的極速行情系統后,系統延遲降低一個數量級,并且系統都能保持在20ns以下,為交易客戶提供了先機。

所謂“英雄所見略同”,星云智聯CEO于勇認為,未來的數據中心將不再以通用CPU為核心,而是解構成GPCPU、GPU、TPU、FPGA、DSP等異構算力資源池,以及SSD和磁盤等存儲資源池。“未來十年,全球云計算和數據中心基礎架構將迎來顛覆性變革,基于DPU的統一通信服務平臺(CAAS)是未來架構的核心引擎。”

除了DPU,現在業界的另外一個熱詞就是IPU,就在近日,英特爾推出XPU產品的最新成員——基礎設施處理器(IPU),具體來說,IPU是一種可編程網絡設備,擴展了智能網卡功能,這有點類似NVIDIA的DPU。

不過業界對于IPU的定義也不盡相同,Graphcore的IPU是指Intelligence Processing Unit,智能處理器。在Graphcore高級副總裁兼中國區總經理盧濤看來,CPU和GPU都不是專門為AI而設計。而IPU是專為AI應用設計,其強大的并行處理能力確保了快速訓練模型的實現,并能進行實時操控。

當計算系統變得更加專用化之后,分層就會顯現,異構的進程就會加快。隨著工作負載類型的細分以及半導體產業鏈的變化,未來新型專用加速器會越來越多,以更好地滿足不同場景的需求。

國產芯片的“彎道超車”

在當前計算產業面臨變革之際,我們看到中國廠商的機會也在出現。在新環境和新技術驅動下,國產CPU正處于奮力追趕的關鍵時期,以飛騰、鯤鵬、海光、龍芯、兆芯、申威等為代表的廠商正全力打造“中國芯”。

以華為為例,其聚焦鯤鵬和昇騰,構建全場景多樣性智能計算平臺。自2019年華為發布計算戰略以來,鯤鵬計算產業生態蓬勃發展,不僅構建了完整的生態體系,并且鯤鵬行業解決方案已在國計民生行業核心系統獲得了規模化應用。

鯤鵬計算產業的能力輸出,離不開其“硬件開放、軟件開源、使能合作伙伴”的技術生態戰略。基于鯤鵬生態,各行各業可快速上手基于華為鯤鵬和昇騰處理器的IT基礎設施及行業應用,包括PC、服務器、存儲、操作系統、中間件、虛擬化、數據庫、云服務及行業應用等,在大數據與人工智能場景,發揮其架構優勢,釋放多元算力。

到目前為止全國已落地24家生態創新中心、12家OEM整機伙伴、2700多家合作伙伴、5700多個解決方案認證、40萬鯤鵬開發者,在各行業中已有成熟應用案例,包括電信、互聯網、安平、能源、金融、交通、制造、政務等。

目前在國際環境、產業政策、市場需求的聯合驅動下,一大批國產CPU廠商奮楫前行,在工藝、性能、生態建設等多個方面不斷取得突破,產業布局、資金投入、技術研發、人才培養等各個方面都在快速進步。

未來會有更多的中國優秀芯片企業涌現出來,國產芯片的水平也一定會彎道超車。我們在全球芯片產業鏈上的話語權,也一定會越來越大!

面向未來的前沿計算

既要腳踏實地,又要仰望星空。如果說前面說到的各種XPU已經近在眼前,那么英特爾和IBM在神經擬態計算(類腦計算)和量子計算的前沿研究給予我們的可能是希望,它們帶來的前所未有的創新成果,為計算的未來帶來了新的想象空間。

神經擬態計算模擬的是大腦的計算模式,包含很多并行計算和異步計算,不需要提前進行數據訓練,可以在工作的過程中自我進行學習,大幅提升效率和能耗。

英特爾已經推出由768個Loihi組成的神經擬態計算系統Pohoiki Spring,擁有1億個神經元,并成立了神經擬態計算社區,推動神經擬態計算落地。

量子計算已經成為全球科技領域關注的焦點,英特爾推出了代號為“Horse Ridge”的低溫控制芯片,實現了對多個量子位的控制,可以實現更大的量子系統擴展。

除了英特爾,我們看到IBM在量子計算領域也在積極布局——2016 年,開放量子云平臺,接入5比特的量子芯片Canary ;2019 年,IBM實現了27個比特的量子芯片Falcon;前不久,IBM 向其IBM Q Network成員發布了65個比特的量子處理器Hummingbird。

從2000年起,IBM開始探索超導量子位這一技術路線,2021年,IBM將突破100比特的關卡,推出127比特的Eagle處理器。在Eagle處理器上,IBM引入并發實時經典計算能力,這將允許執行更廣泛的量子電路和代碼。

除了量子計算,IBM近日發布了全球首個2納米芯片制造技術,再次引領了半導體行業的潮流。

在英特爾、IBM等均先后投入量子運算領域發展, NVIDIA在GTC 2021也宣布推出名為cuQuantum的開發工具組,讓開發者能透過此開發工具組配合NVIDIA GPU進行量子運算特性模擬加速。

困境與挑戰

展望未來,隨著XPU戰略的推進,各大半導體廠商以自身優勢產品為依托,不斷探索算力的跨界融合,這一趨勢也將延續下來。

不過,芯片架構五花八門,指令集不同,無法兼容,而面向芯片的編程庫又跟芯片綁定,靈活性差。小公司只做了其中一個環節,這造成生態的縱向不通;大公司希望構建封閉的系統,這造成了生態的橫向不通。

芯片從制造出來到大規模用起來,往往還隔著一個巨大的生態鴻溝。芯片應用一般都面臨著開發者學習成本高、用戶應用遷移困難、芯片制造公司難以上規模的困難和挑戰。

在有些芯片造出來后,面向開發者的幫助文檔、調試工具或者交流問答社區建設不足,導致開發者學習時間長,難度大,如果學習多個芯片,難度更大,開發者的學習積極性下降。而對于芯片的最終使用者來說,由于芯片指令集或芯片架構的差異,導致編程庫、編程模型、算法框架無法有效的橫向拉通,致使大量的應用遷移困難,可能只是1%的小小的依賴,就會導致適配工作前功盡棄,進一步帶來計算的復雜性。

而芯片供應商如果想解決開發者的問題、想解決使用者的問題,則往往需要投入比芯片研發成本高數十倍的推廣費用。

不管是英特爾還是英偉達,他們的硬件產品只是一方面,他們也在將自身定位一家軟件公司。例如英特爾內部有超過1萬人在圍繞芯片的配套支撐、應用適配、優化調優做工作。英偉達提供一系列基于NVIDIA AI以及用于仿真、協作和自主機器訓練的軟件,尤其是公司的CUDA軟件環境更是通過長期的大規模投入,才打造了其GPU在HPC和AI方面的領先地位。

軟件是釋放異構計算性能的重要一環。英特爾一直也在FPGA、ASIC、GPU和CPU的多種算力產品XPU基礎上開發適配的軟件,推出了開源的跨架構開發模型oneAPI。

軟件開發人員可以使用oneAPI開放式跨架構編程來優化其應用程序,從而避免了專有模型的技術和經濟負擔。英特爾oneAPI工具包通過高級編譯器、庫以及分析和調試工具幫助實現處理器的卓越性能、人工智能和加密功能。

英特爾架構、圖形和軟件集團副總裁兼中國區總經理謝曉清表示,英特爾的戰略是希望能夠把IA生態系統的開發者最大限度地無縫鏈接到oneAPI所支持的異構計算領域,為英特爾的XPU戰略打下一個堅實的軟件基礎。

其實,AMD在異構計算整合方面也早有布局,并選擇了四步走的持續性戰略,其中第四步是架構和系統整合,從硬件到軟件完全實現異構計算支持。

2012年,AMD成立了一個HSA(異構系統架構)基金會,拉了ARM、Imagination、聯發科、德州儀器、三星等眾多一線大廠一同上陣,主推一個叫做OpenCL的異構編程框架。

2015年,AMD宣布名為“Boltzmann計劃”的新款開發工具套件,協助用戶更簡單地開發兼具高性能與低耗能的異構計算系統。“Boltzmann計劃”利用HSA架構優勢,發揮CPU與AMD FirePro GPU計算資源,通過軟件同時釋放極致計算效率。

綜上所述,XPU不能僅僅是XPU,它不是硬件簡單的物理堆砌,而要考慮到其中的互聯互通,跨架構的軟件協同,只有軟硬件協同發展,才能更好的發揮出產品應有的價值。

誰“朋友圈”大

“單兵作戰”的效果往往不如“軍團作戰”,其中的奧秘就是“協同作用”。舉例來說,飛機作戰,如果只是轟炸機單兵作戰,雖然攻擊性很強,卻缺乏保護體系,需戰斗機協同作戰,以保護轟炸機的安全。

產品組合以及解決方案才是芯片廠商競爭力的重要表現,這一方面是廠商自身的豐富產品組合,例如XPU便是重要策略。另一方面,芯片廠商的生態建設,積極擴大“朋友圈”。如果產品是一家企業的根本,那么生態活動則是“眾人拾柴火焰高”。

英特爾公司副總裁兼至強處理器與存儲事業部總經理Lisa Spelman表示,對于英特爾來說,提供滿足客戶需求的產品組合,這是非常巨大的差異化的競爭優勢,這是英特爾數據中心戰略的核心。

“我們的關注點是通過產品組合傳遞客戶價值。我們現在要將產品提升到系統層面的解決方案。英特爾新增加的產品和解決方案都是作為整個平臺的延續給客戶提供價值和解決問題。”Lisa Spelman說。

為了讓產品方案化,英特爾還推出了英特爾精選解決方案和英特爾市場就緒解決方案,幫助客戶加速云、人工智能、企業端、高性能計算、網絡、安全和邊緣應用上的部署。其中近80%的英特爾精選解決方案將在今年年底前完成更新為搭載第三代英特爾至強可擴展處理器。

其實不光英特爾,我們看到不管是Arm還是英偉達等廠商,都在積極構建生態圈。例如Arm生態系統在移動和嵌入式方面一直很強大。從Arm架構發展歷程來看,通過社區建設增強用戶認知度,打造成熟的生態系統是其取得成功的關鍵因素。

同時,Arm借助v9的推出也在向其他計算領域延展。通過將全面計算的設計原則應用在包含汽車、客戶端、基礎設施和物聯網解決方案的整個IP組合中,Arm v9系統級技術將遍及整個IP解決方案,并改善個別IP。

英偉達也一樣,其也在積極發展軟硬件一體化的組合,并借助合作伙伴生態系統在HPC和AI等領域拓展更為廣闊的空間。例如借助英偉達企業合作伙伴計劃(NPN),英偉達在全球范圍內擁有超1500名合作伙伴,提供加速網絡、分解式網絡以及軟件定義的網絡,以滿足 AI、云和高性能計算快速增長的需求。

總之,借助生態系統將自身的XPU產品組合以及與合作伙伴聯合打造的解決方案觸達用戶是半導體廠商贏得市場的關鍵。

結語

數字時代對計算力提出了前所未有的要求,算力將成為新的生產力。

這反映到產業層面,眾多芯片廠商競相切入XPU的賽道。展望未來,通用計算市場穩中求變,不管是x86、Power、Arm等在保持既有技術優勢的同時,也在不斷適配和拓展新的應用場景。

對于GPU、FPGA等加速計算芯片市場,隨著AI類工作負載成為主流,他們的發展空間巨大,但是這些加速芯片需要與通用計算芯片協同工作才能更好地發揮其自身價值,這也預示著類似英特爾、AMD、英偉達、Arm等廠商會在通用計算和加速計算兩個市場展開積極布局。

對于ASIC專用芯片市場,雖然這是一個相當長尾的市場,但是該市場的創新活躍度是最高的,成為眾多創新創業公司的目標領域。雖然他們現在還不是市場主流,但是在滿足客戶定制化的需求方面,ASIC芯片的重要性是不言而喻。

國產芯片的發展任重道遠,但是在外部環境和國家政策的驅動下,國產芯片的被重視程度會越來越高,但是國產半導體芯片廠商的成長之路注定是不平坦的。

雖然神經擬態計算(類腦計算)和量子計算還處于研究探索階段,但是其展示了未來的無限可能。隨著相應研究投入的持續增加,相關應用也會涌現,這點也值得我們持續關注。

在全景展現XPU產業之際,我們也看到芯片廠商需要在軟硬件協同、生態構建等方面還有巨大的改善空間,他們需要傾聽客戶和用戶的聲音,通過需求驅動產品和技術的發展。

站在數字經濟發展的新階段,算力的價值日漸凸顯。隨著大數據、人工智能、邊緣計算等技術的發展,計算架構的“新黃金十年”已經開啟,計算產業正在迎來新的發展機遇。

展望未來,XPU市場將呈現百花齊放的局面,各種芯片在各自的賽道發揮自身獨特的價值。同時各種計算架構之間在聚焦自身優勢的同時,也在相互融合協同,形成了“你中有我,我中有你”的局面。

關鍵字:芯片產業格局FPGACPU

本文摘自:至頂網

電子周刊
回到頂部

關于我們聯系我們版權聲明隱私條款廣告服務友情鏈接投稿中心招賢納士

企業網版權所有 ©2010-2024 京ICP備09108050號-6 京公網安備 11010502049343號

^
  • <menuitem id="jw4sk"></menuitem>

    1. <form id="jw4sk"><tbody id="jw4sk"><dfn id="jw4sk"></dfn></tbody></form>
      主站蜘蛛池模板: 四平市| 县级市| 视频| 汕头市| 甘德县| 丰台区| 缙云县| 十堰市| 拜城县| 定陶县| 阳江市| 神木县| 昔阳县| 枣庄市| 光泽县| 喜德县| 襄城县| 冕宁县| 宜宾县| 三明市| 沧源| 博爱县| 新巴尔虎右旗| 阿瓦提县| 内江市| 额敏县| 深州市| 桐柏县| 凤山县| 板桥市| 彩票| 定兴县| 温泉县| 玛多县| 长宁县| 锡林郭勒盟| 正镶白旗| 额敏县| 芜湖市| 镇沅| 彰武县|