如今,人工智能的應用越來越廣泛。機器學習和深度學習這兩個術語也隨之出現,而機器學習與深度學習并不是非此即彼的排斥關系。深度學習是機器學習的一個子集,而這兩者都是人工智能(AI)的子集。但是,在機器學習和深度學習的定義和用例方面,市場上還存在很多混淆之處,所以在此進行一下澄清:
•人工智能(AI)是在計算機系統和機器中模擬和模仿人類智能行為的研究。
•機器學習是人工智能的一個子領域,它使用算法將人工智能的概念應用到計算系統中。通過計算機識別,并根據數據模式采取行動。隨著時間的推移,機器學習沒有明確的編程來提高其準確性。機器學習落后于預測編碼、聚類和視覺熱圖等分析。
•深度學習是機器學習的一個子領域,是人工神經網絡的另一個名稱。深度學習計算機網絡模擬人類大腦感知、組織和從數據輸入作出決定的方式。
機器學習與深度學習
事實上,人們對機器學習與深度學習的想法忽略了“深度學習是機器學習的一個子集”這一點。人們更有可能在其應用程序中使用機器學習,而不是深度學習。深度學習仍然是一個發展中的技術,而且如果進行部署,其代價昂貴。但是目前有一些產品已經上市,隨著時間的推移,深度學習將變得越來越普遍。
以下來看兩者之間的區別和使用情況:
機器學習
作為人工智能的一個子集,機器學習使用算法來解析數據,從結果中學習,并運用機器學習來做出決定或預測。其示例包括聚類、貝葉斯網絡和可視化數據映射。例如,在電子發現和合規性調查中,熱圖和視??覺集群可將圖形搜索結果呈現給工作人員,他們可以使用結果深入研究其他模糊的數據。
機器學習技術分為兩類:監督機器學習和無監督機器學習。監督式學習取決于人為生成的種子集,教導軟件如何定義數據。預測編碼就是一個很好的例子,該軟件指的是將數據模式與相關百分比匹配的種子集。隨著時間的推移,預測編碼工具將從正在進行的審閱者反饋中學習。
無監督機器學習依賴于識別數據中包含的模式,并將其與其他數據或搜索查詢進行比較。機器學習算法隨著數據集的增長和更多模式的出現而隨時間學習。無監督機器學習包括集群、概念搜索和近似重復數據刪除。
例如,聚類匹配文檔之間相似的文本和元數據,并將數據呈現在可視化集群中。概念搜索通過識別和匹配概念來擴展基于文本的查詢。通過近似重復數據刪除那些比較類似的數據,并根據相似度排除文檔,而在電子郵件線程中,將孤立的電子郵件鏈接到相應的線程。這些分析中的每一個都從其行動中學習,以提高性能和準確性。
機器學習基礎設施差異很大,單一系統可以實現有限的集群或網絡流量報告,而大型系統則包含數十臺服務器和大規模并行處理(MPP)架構,以便跨多個數據源處理海量數據。
深度學習
深度學習(也稱為人工神經網絡)基于所有機器學習算法。但是,它并沒有使用數據分類等任務特定的算法。相反,它通過識別來自非結構化輸入的代表性數據,并輸出準確的行動和決定來模擬人類的大腦結構和功能。
深度學習可以被監督或不受監督,這意味著大型神經網絡可以接受標記的輸入,但不需要它。學習程序教會神經網絡如何構建不同的處理層,但是當網絡處理輸入時,它們根據數據輸入和輸出創建自己的層。這種深度學習的水平允許神經網絡自動從原始數據中提取特征,而無需額外的人工輸入。
神經網絡由多個簡單連接的處理器(稱為神經元)組成,這些神經元是為模仿人腦中的神經元而創建的數學函數。這些人造神經元組成了神經網絡的單元。簡單地說,每個神經元接收兩個或更多的輸入,處理它們,并輸出一個結果。一些神經元接收來自外部傳感器的輸入,而另一些神經元則被來自其他活動神經元的輸入激活。神經元可能激活額外的神經元,或者可能通過觸發動作影響外部環境。所有的活動都是在自創的隱藏層中進行的,每一個連續的層再輸入前一層的輸出。
實際上,神經網絡攝取非結構化數據:聲音、文本、視頻和圖像。網絡將數據分成數據塊,并發送給單獨的神經元和層進行處理。一旦這個離散的處理完成,網絡產生最后的輸出層。
大規模的可擴展性是神經網絡的關鍵。神經網絡的性能取決于它可以攝取、訓練和處理多少數據。數據越多意味著效果越好。這是另一個區別于機器學習的地方,其算法通常在一定水平上保持平穩。深度學習只是通過其計算資源來限制其性能。因此,神經網絡的“深層”部分:計算資源越多,層次越深,輸出越廣泛。盡管深度學習不是那么快捷和容易,但較低的計算處理能力卻使研究和發展發生了革命性的變化。
機器學習和深度學習的常用用例
重要的是要記住機器學習的用例已經出現在市場。深度學習的用例主要是現階段的發展目標,其商業化程度有限。有一些用例是相似的:區別在于神經網絡可以增長到接近無限的學習和輸出規模。機器學習更受約束,適合具體的實際計算任務。另外請記住,深度學習和機器學習不是相互排斥的。
機器學習和深度學習用例的對比
·營銷:
機器學習:合規性電子郵件和社交媒體的情感分析使用文本提示來提醒情緒狀態。
深度學習:通過情緒分析從照片和視頻中識別實時情緒。其應用程序包括基于人類觀察者的情緒反應提供動態內容或視覺顯示。
·無人駕駛汽車
機器學習:基于傳感器信息的無人駕駛汽車
深度學習:基于視覺模式識別的無人駕駛汽車,例如可以立即識別消防栓和行人之間的差異。深度學習還可以通過檢測引擎聲音的波形來實現汽車缺陷檢測。
·監視分析
機器學習:監視分析系統是基于規則的,通過用戶生成的定義和規則分析饋送。
深度學習:這些系統基于行為分析。它觀察詳細的視覺線索,并教導自己哪些行為是觀察對象的正常行為。聯網的深度學習系統也可以識別來自時間和地點不同的照片和視頻的相同面孔。
·生命科學
機器學習:采用醫療用戶程序算法來識別糖尿病人群中的變量。
深度學習:預測個體患者的風險因素。通過識別視覺標記物識別MRI掃描中的癌癥標記物。
·語音識別
機器學習:機器學習可以使語音識別隨著時間的推移向用戶學習。這個過程是一種密集訓練,可以達到平均95%的準確性。
深度學習:神經網絡處理數十億個口述音頻片段,將語音識別的準確性提高到接近100%,同時縮短訓練時間。語音識別還通過關鍵詞和主題對原始音頻進行分類,并識別發言者,這對音頻監控技術發展具有廣泛的影響。
·娛樂節目
機器學習:大型CGI游戲可以使用機器學習來幫助自動實現密集的視覺效果,如插入數字或可視的巨大的空間爆炸。
深度學習:深度學習使得媒體和游戲能夠響應用戶輸入、動作和/或表情而動態地繪制動畫。
展望機器學習和深度學習的未來
人們在日常生活中并不會找到深度學習/人工神經網絡的例子。他們普遍需要大量的標記數據進行監督學習,或大量的非結構化數據進行無監督學習。深度學習技術開發人員需要花費大量的時間標記,并向神經網絡輸入數據,或者需要輸入數以百萬計的非結構化對象來實現無監督學習。
在當今數據密集型的世界里,擁有足夠的數據并不是問題。標記足夠的數據,或者向神經網絡引入足夠的未標記數據是企業面臨的一個挑戰。盡管企業的處理能力不斷增加,硬件價格也有所下降,但密集計算仍然需要企業對系統和支持進行大量的投資。
盡管如此,深度學習在許多不同的業務垂直領域都有很好的用例。像谷歌和Facebook這樣的行業巨頭正在投資深度學習的研究。
版權聲明:本文為企業網D1Net編譯,轉載需注明出處為:企業網D1Net,如果不注明出處,企業網D1Net將保留追究其法律責任的權利。