ARM為推動旗下64位v8架構進軍高性能計算而新開發了向量指令集。其中富士通也參與了該項開發工作,這也是繼K計算機后的又一力作。K計算機是日本理研研究所基于Sparc的系統,2010年的運算速度達每秒8千萬億次,當時曾是世界上最強大的計算系統。
ARM此舉標志著ARM處理器內核首次進軍超級計算機領域。目前涉足該領域的產品還比較匱乏,而英特爾的x86目前占據主導地位。ARM希望成為繼英特爾之后的另一家主導廠商,以逐漸取代來自IBM和Cray生產的處理器。
另外,ARM的強大之處在于其功率效率與x86相比有著更多潛力。超級計算機設計人員在打造超規模系統時往往為所需的巨大功率為難,現在ARM所提供優越的功率效率可為超級計算機設計人員提供幫助。
ARM目前支持的Neon SIMD指令僅限于128位運算,側重于客戶端系統中的圖像和視頻應用。該指令集合的可縮放矢量擴展 (SVE) 支持128位至2048位的運算,每級增量為128位。此外,用戶所寫的向量代碼也可在任何大小的矢量上運行,無需重新編譯,這點據稱是其他任何系統都無法做到的。
SVE作為一套新的指令集,主要針對科學計算等工作負載,并非基于DSP媒體加速。富士通表示,希望能在2020年的后K(post-K)計算機里使用這些指令,令其容量和效率達到以前系統的50倍。
SVE的架構為加載/存儲型,用了最多32個向量寄存器和16個斷言寄存器,另附控制寄存器和First-fault寄存器。在管理各種控制回路所做決定的時候,ARM在編程空間里為SVE未來的擴展留有更多余地。
據悉,ARM現正在與一批合作伙伴合作開發SVE相關規范,規范預計明年年初就緒。ARM亦著手開源這些擴展的Linux版本。
在不同長度向量情況下,ARM的SVE展現了重大的規模性優勢。圖中結果是基于編譯后的代碼在不同長度向量下模擬得到的。
所有ARM的64位許可證購買者都可以獲取SVE技術。ARM首席設計師Nigel Stephens在一次活動上表示,ARM的幾個合作伙伴參與了開發SVE的工作,但ARM不想公布這些名字。
對于富士通而言,與ARM合作是為了在ARM挺進高性能系統的啟始階段與其建立起伙伴關系。
富士通后K計算機的首席設計師俊男吉田表示,“后K計算機的目標是在2020年達到Exaflop的性能級別,而Sparc仍是富士通企業服務器的首選技術,但富士通認為基于ARM芯片的新型科學技術系統的商機是存在的。”
吉田表示,富士通系統將使用512位的SIMD矢量單元,其I/O會使用到旗下的Tofu互連的一個版本和其他加速器內核。另外,他不愿評論該芯片針對的"領先優勢"處理節點是什么。
富士通選擇了512位的向量長度是因為它正好是以前基于Sparc系統的256位SIMD的兩倍。吉田表示,"我們想慢慢進入這一領域。"另外,SVE可置于28位編碼區域,只有64位ARM內核才具備該能力。