認知計算是IBM提出的概念,認為“認知計算”是通過與人的自然語言交流及不斷地學習,從而幫助人們做到更多的系統,是從硬件架構到算法策略、從程序設計到行業專長等多個學術領域的結合,能夠使人們更好地從海量復雜的數據中獲得更多洞察,從而做出更為精準的決策。IBM清晰地把認知計算定義為——具備規模化學習、根據目標推理以及與人類自然互動能力的系統。
認知計算和大數據分析有何區別?
大數據分析屬于認知計算的一個維度。與大數據相比,認知計算的范圍更廣、技術也更為先進。
認知計算和大數據分析有類似的技術,比如大量的數據、機器學習(MachineLearning)、行業模型等,大數據分析更多強調的是獲得洞察,通過這些洞察進行預測。此外,傳統的大數據分析會使用模型或者機器學習的方法,但更多的是靠專家提供。
對于認知計算而言,洞察和預測只是其中的一種。但是,認知計算更為強調人和機器之間自然的交互,這些維度都不是傳統的大數據分析所強調。
此外,認知計算目前成長很快的一個領域為深度學習(DeepLearning),它的學習方法與傳統方法不同,更多的是基于大量的數據通過自學的方式得到這樣的模型,而不需要很多的人為干預,這個從學習方法來講和大數據分析有很多不同的地方。
CPU、GPU、ASIC等傳統計算資源的瓶頸
近十年來,人工智能又到了一個快速發展的階段。深度學習在其發展中起到了中流砥柱的作用,盡管擁有強大的模擬預測能力,深度學習還面臨著超大計算量的問題。在硬件層面上,GPU、ASIC、FPGA都是解決龐大計算量的方案。
在2006年的時候,人們還是用串行處理器處理機器學習的問題,當時Mutch 和 Lowe開發了一個工具FHLib(feature hierarchy library)用來處理hierarchical 模型。對于CPU來說,它所要求的編程量是比較少的并且有可遷移性的好處,但是串行處理的特點變成了它在深度學習領域的缺點,而這個缺點是致命的。時至今日,據2006年已經過去了十年,過去的十年集成電路的發展還是遵循著摩爾定律,CPU的性能得到了極大的提升,然而,這并沒有讓CPU再次走入深度學習研究者的視野。盡管在小數據集上CPU能有一定的計算能力表現,多核使得它能夠并行處理,然而這對深度學習來說還是遠遠不夠的。
GPU:雖然走進了研究者的視線,相比于CPU,GPU的核心數大大提高了,這也讓它有更強大的并行處理能力,它還有更加強大的控制數據流和儲存數據的能力。在 Chikkerur進行了CPU和GPU在處理目標識別能力上的差別,最終GPU的處理速度是CPU的3-10倍。
ASIC:專用集成電路芯片(ASIC)由于其定制化的特點,是一種比GPU更高效的方法。但是其定制化也決定了它的可遷移性低,一旦專用于一個設計好的系統中,要遷移到其它的系統是不可能的。并且,其造價高昂,生產周期長,使得它在目前的研究中是不被考慮的。
FPGA是計算的未來?
FPGA:FPGA在GPU和ASIC中取得了權衡,很好的兼顧了處理速度和控制能力。一方面,FPGA是可編程重構的硬件,因此相比GPU有更強大的可調控能力;另一方面,與日增長的門資源和內存帶寬使得它有更大的設計空間。更方便的是,FPGA還省去了ASIC方案中所需要的流片過程。FPGA的一個缺點是其要求使用者能使用硬件描述語言對其進行編程。但是,已經有科技公司和研究機構開發了更加容易使用的語言比如Impulse Accelerated Technologies Inc. 開發了C-to-FPGA編譯器使得FPGA更加貼合用戶的使用,耶魯的E-Lab則開發了Lua腳本語言。這些工具在一定程度上縮短了研究者的開發時限,使研究更加簡單易行。
Linux On Power+GPU+FPGA=面向未來的認知計算
創新的Linux on power結合FPGA、GPU的計算模式,這也許是面向未來的認知計算最佳架構。
IBM在2015年宣布了與FPGA芯片設計商Xilinx進行“為期數年的戰略協作”。兩家公司將聯起手來,通過OpenPOWER Foundation致力于找到更好的方法處理機器學習、網絡功能虛擬化(NFV)、基因、高性能計算和大數據分析等應用程序。
IBM的開發人員將針對OpenStack、Docker和Spark建立解決方案堆棧,結合了基于POWER的服務器,并具備Xilinx FPGA加速器。
此外,McCredie還宣布該公司將把POWER 8芯片同Nvidia Tesla K80 GPUs結合在一起,使用NVIDIA的高速NVLINK互聯。兩家OEM——Penguin Computing和E4 Engineering將會把基于OpenPOWER設計理念的系統推向市場。
據IBM內部測試顯示,與基于英特爾E5-2699 V3處理器的服務器相比,新Power Systems LC服務器能夠以不到前者一半的成本運行Twitter簡訊分析、網頁視圖顯示等數據密集型工作負載,為客戶每一美元的成本支出提供領先于前者2.3倍的性能。憑借其高效率的設計,LC服務器在相同的機架空間里能夠比基于英特爾處理器的同等服務器多運行94%的Spark社交媒體工作負載。
用于商業計算和高性能計算的2插座2U Power Systems S822LC配備最多20個核、1TB內存和230GB/秒內存帶寬。用于高性能計算的S822LC還配備NVIDIA特斯拉加速計算平臺的旗艦組件——兩個集成的NVIDIA Tesla K80 GPU加速器。與配置類似、基于x86架構的E5-2699 V3服務器相比,兩款S822LC產品能夠提供領先于前者逾2倍的單核性能、高于前者40%的性價比以及在滿內存配置情況下超過2倍的內存帶寬。