今天下午,在北京舉行的GTC CHINA 2016(GPU技術大會)中,英偉達深度學習研究院對CNTK中圖像識別功能進行了簡單介紹。
首先,我們來了解下CNTK。
CNTK(Computational Network Toolkit)是由微軟研究院開發的開源計算網絡工具包,它通過一個有向圖對一系列的計算步驟進行描述,也是一個統一的深度學習神經網絡工具包。
CNTK的總體架構如上圖所示,這里我們可以簡單地分幾部分進行理解,分別是上中下和左中右兩種理解邏輯。先說上中下部分,最下面的包含IDataReader這一層可以理解為基礎的數據。
想象訓練一個典當行的學徒鑒別古董的真假,你需要先拿一些真真假假的古董讓他自己去領會,這個就是學習的過程,也是初始數據的輸入過程。
學習的結果就是第二層包含CN的東西
可以理解為典當行學徒通過真真假假的古董所領悟到大腦的知識
最上面的IExecutionEngine
其實可以理解是這個典當行學徒的個人行為,顧客拿了一個古董,讓其鑒別其真假,這就是最上層的作用或者是意思。
其次左中右部分,最左邊是輸入的原始數據,這里引入了CN Description也就是網絡的描述
可以理解為典當行學徒的師傅給予的指導性意見或者是古董鑒別教科書
而Features&Labels中的Features就是樣本或者古董,Labels可以理解是古董樣本上標明真真假假的標簽
中間的是ICNBuilder是學習的行為的驅使,IDataReader是仔細觀察并且檢驗所學內容的行為的驅使。最右邊的ILeaner是學習方法,CN之前解釋過了是學習的成果,IExecutionEngine也就是最終拿來真正東西進行檢驗的行為。
可以說CNTK的總體架構,描述了一個典當行學徒的從入門到精通的學習過程。從樣本訓練自己,形成自己的能力,然后使用其所學。
根據研究人員的描述,由于具備更為優秀的交互能力,CNTK工具包中圖像識別速度比另外四個當下主流的計算工具包都更加受開發者的歡迎。
在微軟最新發布的CNTK1.7版本中,CNTK已經支持英偉達的最新的深度神經網絡資料庫cuDNN5.1。
其實在Facebook、百度等巨頭的人工智能研究中,經常用到英偉達的GPU。
Facebook的Big Sur服務器是圍繞本來為圖片處理而開發的大功率處理器——GPU來設計的。每8個GPU就配置一臺Big Sur服務器,Facebook使用的正是擅長于圖像識別的英偉達制造的GPU。
百度將把英偉達的GPU應用到其無人駕駛系統的車載電腦中。這臺電腦可以解決汽車廠商在融合無人駕駛技術時面臨的一大問題:如何將人工智能技術集成到緊湊的電腦中,從而幫助汽車制定決策。除了為無人駕駛、以及深度學習的復雜計算提供強勁性能支持外,它還能夠同時驅動多個高分辨率的顯示設備,應用于智能汽車中的儀表盤、地圖導航、車載中控面板等。
幾乎所有巨頭都在依靠強大的圖形處理單元(GPUs)來進行深度學習應用,從而處理更為復雜的算法,能提高人工智能和識別能力,微軟在此方面也不甘落后。