在不久前36氪聯合主辦的融合了音樂、科技與藝術的MTA天漠音樂節上,微軟亞洲研究院的張霖濤提出,人工智能有三個重要的支柱點,分別是大數據、新算法和大系統。微軟在大系統方面的努力是推出了開源的認知工具包Microsoft Cognitive Toolkit(之前叫做CNTK),現在這個工具包已經正式升版(2.0)并面向開發者開放。微軟稱在該系統幫助下,開發者可以在不具備深厚知識的情況下開放機器學習系統。
此次升級是在去年10月底推出的2.0 beta版基礎上改進的。微軟正是在該beta推出時將工具包的名字從Computational Network Toolkit(CNTK)更名為Cognitive Toolkit。同時引入了若干關鍵的功能特性,包括對Python的支持,增強的性能和學習能力等。
此次2.0版的升級主要提供了若干的新功能,包括對用于搭建神經網絡的流行高層神經網絡Python API Keras的支持(beta版)。鑒于此前另外兩個流行的機器學習框架TensorFlow和Theano已經支持Keras,微軟的此次更新意味著數據科學家可以輕易地在三種不同的后端之間移植代碼。當然也會增加微軟框架對開發者的吸引力。
此外,工具包還增加了對壓縮模式的支持,在壓縮模式下框架可以更容易地在低功耗的邊緣設備進行部署,從而擴大機器學習的應用范圍。微軟還指出,Cognitive Toolkit將繼續通過對新版NVIDIA深度學習SDK以及NVIDIA Volta等GPU架構的支持來加速訓練能力。
在談到Cognitive Toolkit的優勢時,微軟資深技術院士黃學東表示,微軟的工具包跟其他工具包最大的不同在于數據。Cognitive Toolkit的數據姐幫你上都來自于微軟自己的大規模生產數據。從Cortana到Bing乃至于Cognitive Services 中的Emotion API,這些都是用 Cognitive Toolkit創建出來的。
而香港浸會大學不久前進行的一次評測表明,在一系列利用GPU加速執行機器學習的框架當中,beta版的Congnitive Toolkit 2.0是速度最快的一個。
當然,不管是數據還是性能都不是決定框架流行度的唯一因素。在吸引數據科學家和開發者方面,Cognitive Toolkit目前仍面臨著眾多對手的激烈競爭。比如Google的TensorFlow目前是GitHub上最流行的開源機器學習框架。Amazon Web Services也推出了自己的深度學習框架Apache MXNet,Facebook則在努力推進自己的Caffe2框架。美國的四大巨頭里面也許是蘋果在機器學習的力度上稍弱一點。
所有這些工具都反映出一個更大的趨勢,那就是為開發者提供利用機器學習的工具正在日益成為流行的改進應用的方式。從底層框架到預置的機器學習模型,微軟等都在為開發者提供各種各樣的工具,讓他們在不需要培訓的情況下就能在應用中植入AI能力。而這些巨頭的好處是得以壯大自己的生態體系。