深度學習是機器學習的一個子集,而機器學習是人工智能的一個子集。這些新興技術中的每一項都在幾乎所有領域重塑IT行業(yè)的格局。
從計算機時代開始之前,科學家就被可能創(chuàng)造出像人類一樣的機器的想法所吸引。但在過去十年中,技術進步才能使某些形式的人工智能(AI)成為現實。
隨著人工智能用例數量的激增,人們對人工智能應用的興趣也急劇上升。許多調查發(fā)現,90%以上的企業(yè)或者已經在運營中使用人工智能,或者計劃在不久的將來使用人工智能。
人工智能初創(chuàng)公司渴望利用這一趨勢,都急于將人工智能功能推向市場。在銷售大數據分析和數據科學工具的供應商中,兩種類型的人工智能變得特別受歡迎:機器學習和深度學習。
雖然許多解決方案都帶有“人工智能”、“機器學習”和/或“深度學習”標簽,但這些術語的真正含義的混淆仍然存在于市場中。下圖提供了這些不同技術之間關系的直觀表示:
如圖所示,機器學習是人工智能的一個子集。換句話說,所有的機器學習都是人工智能,但并非所有人工智能都是機器學習。
同樣,深度學習是機器學習的一個子集。同樣,所有深度學習都是機器學習,但并非所有機器學習都是深度學習。
人工智能、機器學習和深度學習都是相互關聯的,深度學習嵌套在機器學習中,而機器學習又是人工智能更大學科的一部分。
人工智能“包含”機器學習和深度學習
計算機擅長數學和邏輯推理,但他們很難掌握人類可以很自然地完成的其他任務。例如,人類嬰兒只有幾個月大時就學會識別和命名物體,但直到最近,機器才能識別圖片中的物體。雖然任何一個蹣跚學步的孩子都能很容易地分辨貓和狗,但電腦實施這項任務要困難得多。事實上,驗證碼服務有時會使用這種類型的問題來確保特定用戶是人類而不是機器人。
在20世紀50年代,科學家們開始討論如何讓機器像人類一樣“思考”。 1956年,約翰·麥卡錫組織了一次關于這一主題的會議,“人工智能”這一術語進入了詞典。那些參加的專家呼吁更多地研究“關于學習的每一個方面或智力的任何其他特征原則上都可以被如此精確地描述,以至于可以制造一臺機器來模擬它的猜想。”
這些早期研究人員中的一些人認為,他們解決這些問題只需要幾年時間。然而實際上,計算機硬件和軟件花費了幾十年才能達到可以實現圖像識別、自然語言處理和機器學習等人工智能應用的程度。
批評者指出,人工智能系統(tǒng)與計算機之間存在著很大的區(qū)別,前者能夠分辨貓和狗之間的區(qū)別,并與人類一樣具有真正的智能。大多數研究人員認為,人們離創(chuàng)造一種人工通用智能(也叫強人工智能)還有幾年甚至幾十年的時間,這種人工智能似乎和人類一樣有意識,如果可能創(chuàng)造出這樣一個系統(tǒng)的話。
如果人工智能的進步有一天會成為現實,那么機器學習似乎肯定會在系統(tǒng)的能力中發(fā)揮重要作用。
機器學習:人工智能的關鍵驅動因素
正如第一次人工智能會議的與會者所說的那樣,機器學習是人工智能的一個特殊分支,它與計算機“自我提高”有關。另一位20世紀50年代的計算機科學家Arthur Samuel將機器學習定義為“在沒有明確編程的情況下學習的能力”。
在傳統(tǒng)的計算機編程中,開發(fā)人員通過計算機實施確切的操作,給定一組輸入,系統(tǒng)將返回一組輸出,就像人類程序員告訴它一樣。
機器學習是不同的,因為沒有人告訴機器究竟該做什么。相反,他們提供機器數據并允許它自己學習。
一般來說,機器學習有三種不同的形式:
(1)強化學習
強化學習是最古老的機器學習類型之一,它在教授計算機如何玩游戲時非常有用。
強化學習對于自動駕駛汽車等應用程序也很有用,在這些應用程序中,系統(tǒng)可以接收有關其是否表現良好或不良的反饋,并使用該數據隨時間推移而改進。
(2)監(jiān)督學習
監(jiān)督學習在分類應用中特別有用,例如教授機器學習系統(tǒng)來區(qū)分狗和貓的圖片。
在這種情況下,人們將為應用程序提供大量以前標記為狗或貓的圖像。根據該訓練數據,計算機將得出關于區(qū)分這兩種動物的結論,并且能夠將其學到的東西應用于新圖片。
隨著系統(tǒng)隨著時間的推移吸收更多數據,它將在任務中變得越來越好。據說這種技術是“監(jiān)督的”,因為它要求人類在學習過程的前沿和之后對圖像進行標記,并監(jiān)督學習過程。
(3)無監(jiān)督學習
相比之下,無監(jiān)督學習并不依賴于人類為系統(tǒng)標記訓練數據。相反,計算機使用聚類算法或其他數學技術來找到數據組之間的相似性。
無監(jiān)督機器學習對于許多企業(yè)領導者感興趣的大數據分析類型特別有用。例如,組織可以使用無監(jiān)督學習來發(fā)現客戶群之間的相似性,并更好地定位其營銷或定制其定價。
一些推薦引擎依賴于無監(jiān)督的學習來告訴人們誰喜歡一部電影或一本書,可能還喜歡其他的電影或書籍。無監(jiān)督的學習也可以幫助識別可能表明某人的信譽或提出保險索賠的可能性的特征。
各種人工智能應用,如計算機視覺、自然語言處理、面部識別、文本對文本、語音對文本、知識引擎、情感識別等,經常使用機器學習能力。一些機器學習的主要類型有兩種或更多的組合,在一些情況下,被稱為“半監(jiān)督”,因為它們包含了一些監(jiān)督學習的技術和一些無監(jiān)督學習的技術。有些機器學習技術(例如深度學習)可以被監(jiān)管、監(jiān)督或兩者兼而有之。
深度學習:推動機器學習和人工智能的動力
“深度學習”這個術語在20世紀80年代首次投入使用,使其成為比機器學習或人工智能更新的概念。
深度學習描述了監(jiān)督和非監(jiān)督機器學習系統(tǒng)有時使用的特定類型的架構。具體來說,它是一種分層架構,其中一個層接受輸入并生成輸出。然后,它將該輸出傳遞到體系結構中的下一層,該層使用它來創(chuàng)建另一個輸出。然后,該輸出可以成為系統(tǒng)中下一層的輸入,依此類推。該架構被稱為“深層”,因為它有很多層。
為了創(chuàng)建這些分層系統(tǒng),許多研究人員設計了以人腦為模型的計算系統(tǒng)。從廣義上講,他們稱這些深度學習系統(tǒng)為人工神經網絡(ANN)。人工神經網絡有幾種不同的類型,包括深度神經網絡、卷積神經網絡、遞歸神經網絡等。這些神經網絡使用與人腦中的神經元相似的節(jié)點。
神經網絡和深度學習在過去十年中變得越來越流行,其部分原因是硬件的進步,特別是圖形處理單元(GPU)的改進,使它們更加可行。傳統(tǒng)上,系統(tǒng)設計人員使用圖形處理單元(GPU)來執(zhí)行顯示高質量視頻和3D游戲所需的高級計算。
然而,這些圖形處理單元(GPU)也擅長深度學習所需的計算類型。隨著圖形處理單元(GPU)性能的提高和成本的降低,人們已經能夠創(chuàng)建高性能系統(tǒng),可以在更短的時間內完成深度學習任務,并且成本遠低于過去的情況。
如今,任何人都可以通過Amazon Web Services、Microsoft Azure、谷歌云和IBM Cloud等云計算服務輕松訪問深度學習功能。