不久前的IDF(英特爾開發(fā)者論壇)大會上主流市場芯片和開發(fā)商消息漫天飛舞,筆者與同事卻注意到幾個不那么耀眼、但卻同樣緊迫的話題。雖然這些事情可能無法與電腦和消費市場相提并論,因其不是那么吸引公眾的眼球,我們關(guān)注的話題事關(guān)未來幾年里整個服務(wù)器空間的設(shè)計方向。
就數(shù)據(jù)中心而言,今年的IDF上最熱門的話題有兩個,一是對Optane 3D XPoint內(nèi)存的更深刻認(rèn)識,網(wǎng)上可以找到更詳細(xì)的資料。另一個熱門話題是與會者可以搜集到英特爾和Altera FPGA關(guān)系的新興技術(shù)和市場前沿的信息。具體來說,從英特爾院士Al Gara和Altera公司策略總監(jiān)Mike Strickland那里,我們對新興力量朝什么方向推動整個局面發(fā)展有了那么一點點更深的體會,先是序幕,只是受金融好奇心的驅(qū)使,目前進入了有著一種廣泛支持的研究現(xiàn)狀,而下一步是實際產(chǎn)品,期望在各種潛在范圍內(nèi)適應(yīng)未來數(shù)據(jù)中心的需求。
至于坊間傳出的關(guān)于FPGA和Xeon的結(jié)合說法,背后兩個頭之間的洽談可以用兩個字概括:信心。基本的感覺是,他們知道一些各方讀者和分析師不知道的事。說到底,如果英特爾分出167億美元給一個一直在喊著要走自己的路的公司,那整件事不會只是局外人表面上看那么簡單,對吧?
回到我們自己提出的問題,初步的猜測是,一些領(lǐng)域的新應(yīng)用可能利用FPGA的優(yōu)勢,從而謀求大規(guī)模增長的潛力,又或者,由FPGA驅(qū)動的交換市場爆炸性發(fā)展,又或者,市場甚至對一種特別的(針對GPU或高測試CPU)加速有極大、無法滿足的需求,比如大型云供應(yīng)商可以用得上這種加速。如果Stickland和Gara給出的提示沒有被理解錯的話,那所有這些東西都是真的,而且,其規(guī)模是我們所預(yù)料不到的,是些即便是短期內(nèi)服務(wù)器市場都無法切入的東西。
這里的重點并不完全在實用上以及FPGA和英特爾處理器的技術(shù)結(jié)合上,重點更多的在于該項宏大的挑戰(zhàn)本身。顯然,性能上的限制在往前發(fā)展時是存在的,有摩爾定律的限制,除此以外,功率限制也越來越大。這才是此項交易的關(guān)鍵所在。Gara在IDF上告訴筆者,“當(dāng)功率受到限制時,要實現(xiàn)一些功能就要找一些特別的方法,以追求性能和平均每瓦的性能,這樣做是非常有益的,能夠提供不同層次的性能。”
Gara表示,“我們認(rèn)識到我們能夠?qū)⒋罅抗δ苷系轿覀兊男酒铮覀円簿陀辛思尤敫嗵貏e功能的機會,利用FPGA,我們有機會做到這一點,而且是以一個更普遍的方法,一個獨特的特定功能不僅僅只是為了一個客戶,它可以為我們提供更多的共性。”
上述說法頗為激勵人心,但算不上未來的路線圖,Gara表示,他認(rèn)為FPGA功能大致可以朝多方面發(fā)展。“就是說,可以向離散和外部設(shè)備方面發(fā)展,就目前外部設(shè)備的狀況而言,F(xiàn)PGA可以進入包裝,甚至存在向處理器核心方面發(fā)展的潛力。這一塊的機會一大把,我不是說我們對于所有這些已經(jīng)搞透徹了,我們確切地知道我們要去哪,但卻也是一個大機會。”
從下圖中可以看到上述各點,其中的QPI鏈接通過PCIe卡提供高帶寬和高速度。有了這個以后,假定其編程模式用的此處所給出,那么稍微想想即不難猜出,英特爾和Altera心里想的模型將會遵循一個一致性模型(Coherency model)。這樣的做法可能會延伸到未來時代,屆時,一切都是在統(tǒng)一的芯片上完成,芯片上類似于我們現(xiàn)在用的CPU和GPU一類的共享內(nèi)存架構(gòu)可以讓一切出現(xiàn)在一個地方。FPGA似乎也可以擁有自己的PCI-Express適配器插槽,即是說,別的東西可以直接與其連接,或是通過至強E5芯片連接。
Gara在IDF討論會上談話的關(guān)鍵是關(guān)于工作負(fù)載加速的概念。當(dāng)然這不是什么新概念;事實上,它是處理器發(fā)展的一部分(曾記否,浮點單元也被視作加速器,直到后來被整合,現(xiàn)在到了到處都是浮點單元的地步)。對于英特爾來說,其演變花了一段時間,目前的例子是Xeon Phi,Xeon Phi整合了高吞吐量組件,這些組件經(jīng)優(yōu)化后成為高性能計算的關(guān)鍵工作負(fù)載。關(guān)鍵的一點是,工作負(fù)載加速的下一步是FPGA元素,從市場的角度來看,工作負(fù)載加速是多樣化的,具有無限的可能性。其應(yīng)用區(qū)域包括超大規(guī)模和云細(xì)分市場,二者極有可能成為英特爾與Altera的FPGA大實驗場,用于實驗應(yīng)用程序和節(jié)點級別的加速。
用于大型云的快速數(shù)據(jù)包
目前還很難確定的說大型云供應(yīng)商是如何看待FPGA潛力的,但可以保險地說,他們很可能也非常了解加速可以在諸如機器學(xué)習(xí)和其他應(yīng)用程序中不同的工作負(fù)載方面發(fā)揮作用,在節(jié)點上也有用。例如,我們早就知道微軟在關(guān)注FPGA,特別是他們的Bing搜索引擎也使用加速。不久前,微軟Azure集團首席技術(shù)官Mark Russinovich談到Azure可以采用FPGA提升智能網(wǎng)卡性能以加強數(shù)據(jù)包的處理。
Russinovich在今年6月的開放網(wǎng)絡(luò)峰會上就其他大型云服務(wù)提供商的方向或許頗為一針見血地指出,“擴展到40 Gbps或以上需要對數(shù)據(jù)包處理進行非常大量的計算。微軟正在Azure SmartNICs上構(gòu)建網(wǎng)絡(luò)接口控制器(NIC)轉(zhuǎn)移,無需消耗CPU資源但可以幫助我們擴展,如此,這些CPU資源就可以提供給客戶虛擬機用。”這位云計算CTO表示,盡管FPGA中還沒有在服務(wù)器上廣泛用于計算加速,但他的團隊正在積極地利用FPGA“和SDN的可編程性達成快速規(guī)模化,專用硬件的性能在業(yè)界是獨特的。”
對于大云供應(yīng)商來說,關(guān)鍵是可編程性、可移植性和靈活性,當(dāng)然,對于其他通用用戶來說也是這樣。人們一般不會很自然地選這幾條來形容FPGA,但英特爾(主要是旗下的芯片業(yè)務(wù)和HDL經(jīng)驗)多年來在這一塊做了大量的工作,Altera公司也在許多相同的問題上辛勤地耕耘著。
當(dāng)然,F(xiàn)PGA和加速器前沿的發(fā)展受益的不單單是云供應(yīng)商。Gara和Stickland均引用了一些諸如高頻交易、科學(xué)計算、網(wǎng)絡(luò)壓縮、存儲加、媒體轉(zhuǎn)碼的應(yīng)用例子以及其他領(lǐng)域里未來重點發(fā)展的例子,這些有一部分是來自現(xiàn)存的工具軟件,如英特爾的數(shù)據(jù)平面開發(fā)工具包、加密和壓縮用的基于硬件加速的QuickAssist工具等等。
在一系列的發(fā)言里,Altera公司Mike Strickland是個中心話題,他圍繞FPGA利用OpenCL到HDL轉(zhuǎn)換器而推動編程方法概述了一些新的和有意思的資料。關(guān)于這一點,如果翻一翻那個幻燈片就可以很明顯地看到,編程環(huán)境正在發(fā)展。筆者以前曾介紹過,現(xiàn)存的OpenCL編譯器可以處理大量繁重的后端工作。Strickland表示,F(xiàn)PGA因此可以在OpenCL以外擁有更廣泛的基礎(chǔ),例如和OpenMP結(jié)合。 他稱,“我們的一些用戶用慣了HDL,他們?nèi)匀豢梢岳^續(xù)用,但可以配合OpenCL內(nèi)核混合用(最終要發(fā)展到OpenMP內(nèi)核)。這里多了一個新的靈活性。”