IBM推出“認知系統”:面向AI提供“一步認知”的Power架構
去年9月,IBM推出了面向高性能計算的IBM Power Systems S822LC服務器(Minsky服務器),其使用的NVidia開發的通信協議NVLink,能夠迅速在CPU及GPU之間建立連接,IBM成為了目前首家同時是唯一一家采用這一技術的公司。作為唯一擁有CPU:GPU NVLink的架構,Minsky服務器使用NVIDIA Tesla P100 解決高性能計算及人工智能對于計算能力提出的新挑戰,在加速計算性能的同時,增強系統的可編程性和可訪問性,并消除 PCI-E瓶頸。目前,這一架構已經實現兩倍于 x86 系統的性能優勢。
基于這一面向高性能計算而優化的計算系統,IBM進一步推出了“認知系統”(Cognitive Systems),面向機器學習、深度學習、自然語言處理、實時高級分析等人工智能相關工作負載,通過BlueMind深度學習云平臺、PowerAI深度學習框架,以及使用NVLink技術的 Minsky服務器提供一個硬件+軟件整合的解決方案,為主流人工智能框架更順暢地運行在Power Systems上提供可能。
面向數據而設計的IBM Cognitive Systems包括以下幾大亮點:
· PowerAI深度學習框架:PowerAI包含了主流深度學習軟件框架,例如用于模型訓練的TensorFlow、Caffe、Torch、Theano以及關聯庫的cuDNN等,通過不斷基于Minsky服務器優化性能,PowerAI為主流深度學習框架工具包交付企業級的支持。并幫助開發人員提升易用性、面向數據科學家縮短模型訓練時間。
· BlueMind深度學習平臺:基于Spark大數據平臺框架,能夠進行深度學習平臺資源管理、調度,擁有優異的并行效率和擴展性能,并且具有豐富的深度學習功能,可幫助用戶在集群或云環境中快捷高效地開發和部署深度學習應用。
· Spectrum conductor軟件定義架構:軟件定義基礎架構解決方案,最大程度發揮系統潛力,并降低與網絡和集群計算相關的直接成本。
· OpenCAPI標準:通過OpenCAPI聯盟對于這一開放式標準的探索,OpenCAPI標準總線將加快數據在數據中心各個層面的遷移速度,每個通道的數據都可達25Gbps,從而進一步提升面向數據密集型工作負載的Power系統的性能優勢。
計算系統與架構持續演進——計算系統的重塑迫在眉睫
IBM Cognitive Systems的推出,與近來計算系統的演變趨勢緊密相關。以往,數據是集中式的,傳統的計算邏輯往往采取程序化的計算方式,以CPU為中心提升計算性能,探索如何有效加速計算流程從而達到更好的數據處理效果。然而隨著分布式數據、非結構化數據逐漸成為主流,計算正在從“程序化的計算”向“以數據處理為中心的計算”演進。對于數據價值的挖掘也更需要內外部結合,將數據整合在一起提供更以數據為中心、更具效率與智慧的計算,而非僅僅是對數據的流程化的處理。
人工智能相關負載需要高性能的數據傳輸,并需要具有最佳準確度的訓練模型,以高效、快速地找出“超級參數”,從而大幅節省模型的訓練時間。因此,AI堆棧的基礎首先是正確的硬件:帶有加速器的服務器,以及正確的存儲設備。
GPU加速計算良好地適應了深度學習訓練“計算密集”這一特性,具有最高CPU-GPU 帶寬的服務器能夠實現高性能的數據傳輸,而這一點正是規模更大、更為復雜的深度學習模型所需的優勢。
正如IBM認知系統高級副總裁Bob Picciano而言:“IBM認為,基礎架構世界不再以CPU為核心,而是從以CPU為中心追求計算性能,轉向追求整體計算系統的效能。未來,計算能量不僅是存在于CPU,而是廣泛涉及到包含GPU、FPGA甚至內存計算等其他設備。IBM在探索的是,如何利用新的技術,讓這些計算能力從以往的程序式計算向未來的有關認知的計算模式轉型,這也是IBM在未來有關計算的發展方向。IBM非常看重在認知時代下對計算系統的重塑,希望通過IBM Cognitive Systems,確保CPU、GPU、I/O、內存等結合在一起,一站式地提供客戶應用人工智能所需的計算能量。”
合力創新為人工智能架構開辟用武之地
除不斷革新計算架構以外,IBM還不斷通過OpenPOWER基金會,聯合合作伙伴共同讓面向AI的創新更具用武之地。通過與OpenPOWER基金會成員合作,IBM 推出了OpenPOWER LC系列的三種新服務器。IBM通過與NVidia及賽靈思合作,加速計算性能的提升及連接效率,已經實現了比x86高3-5倍的CPU和GPU間I/O帶寬,使機器的訓練時間從幾天縮短到幾小時甚至幾分鐘。
此外,由IBM 、AMD、Google、Mellanox以及Micron創建的OpenCAPI聯盟將進一步探索如何打開CPU之間的鏈接,通過全新的“OpenCAPI”標準滿足高性能異構計算的需求,并將在今年下半年發布的Power9服務器中率先應用OpenCAPI,促進OpenPOWER基金會成員開展基于OpenCAPI的創新。
在前不久舉辦的NVidia GTC開發者大會中,AI及深度學習技術不僅成為了會議演講的主題焦點,也在其發布的多項革新性產品中呈現基礎性地位。而近日,賽靈思宣布,和 IBM 聯手利用PCI Express Gen4,超越目前廣泛采用的PCI Express Gen3標準,率先將加速器和CPU之間的互聯性能提升一倍??梢娫贏I應用場景成為大勢所趨的今天,聯合開展新技術探索將能收獲事半功倍的效果。正如IBM大中華區硬件系統部服務器解決方案副總裁施東峰所言:“IBM希望通過OpenPOWER基金會,將我們合作伙伴的創新成果得到最大程度的展現,并將其轉化為AI機會。我們要確保集眾人的智慧,探索出最佳的整合架構,為我們的客戶提供在認知計算時代下的有效的應對方案。”