人工智能:從概念提出到走向繁榮
1956年,幾個計算機科學家相聚在達特茅斯會議,提出了“人工智能”的概念,夢想著用當時剛剛出現(xiàn)的計算機來構造復雜的、擁有與人類智慧同樣本質特性的機器。其后,人工智能就一直縈繞于人們的腦海之中,并在科研實驗室中慢慢孵化。之后的幾十年,人工智能一直在兩極反轉,或被稱作人類文明耀眼未來的預言,或被當成技術瘋子的狂想扔到垃圾堆里。直到2012年之前,這兩種聲音還在同時存在。
2012年以后,得益于數(shù)據(jù)量的上漲、運算力的提升和機器學習新算法(深度學習)的出現(xiàn),人工智能開始大爆發(fā)。據(jù)領英近日發(fā)布的《全球AI領域人才報告》顯示,截至2017年一季度,基于領英平臺的全球AI(人工智能)領域技術人才數(shù)量超過190萬,僅國內人工智能人才缺口達到500多萬。
人工智能的研究領域也在不斷擴大,圖一展示了人工智能研究的各個分支,包括專家系統(tǒng)、機器學習、進化計算、模糊邏輯、計算機視覺、自然語言處理、推薦系統(tǒng)等。
圖一 人工智能研究分支
但目前的科研工作都集中在弱人工智能這部分,并很有希望在近期取得重大突破,電影里的人工智能多半都是在描繪強人工智能,而這部分在目前的現(xiàn)實世界里難以真正實現(xiàn)(通常將人工智能分為弱人工智能和強人工智能,前者讓機器具備觀察和感知的能力,可以做到一定程度的理解和推理,而強人工智能讓機器獲得自適應能力,解決一些之前沒有遇到過的問題)。
弱人工智能有希望取得突破,是如何實現(xiàn)的,“智能”又從何而來呢?這主要歸功于一種實現(xiàn)人工智能的方法——機器學習。
機器學習:一種實現(xiàn)人工智能的方法
機器學習最基本的做法,是使用算法來解析數(shù)據(jù)、從中學習,然后對真實世界中的事件做出決策和預測。與傳統(tǒng)的為解決特定任務、硬編碼的軟件程序不同,機器學習是用大量的數(shù)據(jù)來“訓練”,通過各種算法從數(shù)據(jù)中學習如何完成任務。
舉個簡單的例子,當我們?yōu)g覽網上商城時,經常會出現(xiàn)商品推薦的信息。這是商城根據(jù)你往期的購物記錄和冗長的收藏清單,識別出這其中哪些是你真正感興趣,并且愿意購買的產品。這樣的決策模型,可以幫助商城為客戶提供建議并鼓勵產品消費。
機器學習直接來源于早期的人工智能領域,傳統(tǒng)的算法包括決策樹、聚類、貝葉斯分類、支持向量機、EM、Adaboost等等。從學習方法上來分,機器學習算法可以分為監(jiān)督學習(如分類問題)、無監(jiān)督學習(如聚類問題)、半監(jiān)督學習、集成學習、深度學習和強化學習。
傳統(tǒng)的機器學習算法在指紋識別、基于Haar的人臉檢測、基于HoG特征的物體檢測等領域的應用基本達到了商業(yè)化的要求或者特定場景的商業(yè)化水平,但每前進一步都異常艱難,直到深度學習算法的出現(xiàn)。
深度學習:一種實現(xiàn)機器學習的技術
深度學習本來并不是一種獨立的學習方法,其本身也會用到有監(jiān)督和無監(jiān)督的學習方法來訓練深度神經網絡。但由于近幾年該領域發(fā)展迅猛,一些特有的學習手段相繼被提出(如殘差網絡),因此越來越多的人將其單獨看作一種學習的方法。
最初的深度學習是利用深度神經網絡來解決特征表達的一種學習過程。深度神經網絡本身并不是一個全新的概念,可大致理解為包含多個隱含層的神經網絡結構。為了提高深層神經網絡的訓練效果,人們對神經元的連接方法和激活函數(shù)等方面做出相應的調整。其實有不少想法早年間也曾有過,但由于當時訓練數(shù)據(jù)量不足、計算能力落后,因此最終的效果不盡如人意。
深度學習摧枯拉朽般地實現(xiàn)了各種任務,使得似乎所有的機器輔助功能都變?yōu)榭赡堋o人駕駛汽車,預防性醫(yī)療保健,甚至是更好的電影推薦,都近在眼前,或者即將實現(xiàn)。其原因與以下因素息息相關:
首先,深度卷積神經網絡需要大量數(shù)據(jù)進行訓練。網絡深度太淺的話,識別能力往往不如一般的淺層模型,比如SVM或者boosting;如果做得很深,就需要大量數(shù)據(jù)進行訓練,否則機器學習中的過擬合將不可避免。而2006年開始,正好是互聯(lián)網開始大量產生各種各樣的圖片數(shù)據(jù)的時候,即視覺大數(shù)據(jù)開始爆發(fā)式地增長。
其次,是運算能力。卷積神經網絡對計算機的運算要求比較高,需要大量重復可并行化的計算,在當時CPU只有單核且運算能力比較低的情況下,不可能進行很深的卷積神經網絡的訓練。隨著GPU計算能力的增長,卷積神經網絡結合大數(shù)據(jù)的訓練才成為可能。
最后,就是人和。卷積神經網絡有一批一直在堅持的科學家(如Lecun)才沒有被沉默,才沒有被海量的淺層方法淹沒。最后終于看到卷積神經網絡占領主流的曙光。
有一點需要特別提醒的是,或許,深度學習更值得我們借鑒的是“深度”這一思想,但它是否等同于深度神經網絡,學者們的意見并非一致。比如,南京大學的周志華(西瓜書作者)提出了gcForest(多粒度級聯(lián)森林),在接受采訪時,周志華老師認為,解決復雜問題把模型變深可能是有必要的,但是深度學習應該不只是深度神經網絡,還可以有其他形式,與神經網絡相比,其他形式也許有更好的性質。這段話或許會給我們深刻的警示。
三者的區(qū)別和聯(lián)系
機器學習是一種實現(xiàn)人工智能的方法,深度學習是一種實現(xiàn)機器學習的技術。我們就用最簡單的方法——同心圓,可視化地展現(xiàn)出它們三者的關系。
圖二 三者關系示意圖
當下的人工智能時代,機器學習的重要性不言而喻。