回顧2018年,人工智能在這一年中繼續在數字領域迅猛增長,并將其神奇的力量注入到幾乎每個行業的每個角落,并徹底改變了人們使用數據的方式。如今,很多企業都急于利用深度學習技術來顛覆他們的業務流程?,F實情況是,盡管人工智能已真正改變了視聽識別等領域,但鑒于人工智能為理解語言提供了強大的新工具,并首次提供了具有微弱直覺的算法,但迄今為止,絕大多數商業人工智能應用程序在現實應用中往往沒有獲得多少改進。與傳統方法相比,如果那些系統一開始就得到正確構建,那么這些程序將很快被替換。
如今,很多人對深度學習感興趣,并賦予它幾乎神話般的超人能力。企業急于在每個項目上采用人工智能這樣的新興技術。即使一些面臨風險,傳統行業也在積極采用人工智能技術,例如,在每個成功提案中都需要“社交媒體”的資助機構現在需要在某個地方采用“深度學習”,甚至考慮為每個項目提供資金,無論人工智能對解決目前的問題是否具有適用性。
在公眾意識和企業高管的通常想法中,人工智能被描述為類似人類的算法,這些算法對于人類來說比較初級,不夠智能,但這些算法不斷進行改進,并且可以通過更多的訓練數據來進行學習和修復。
當然,現實情況是當今的深度學習算法更多的是藝術而不是科學。精確度的提高不僅來自于盲目地將更多的訓練數據投入算法,還來自于仔細選擇的訓練數據、錯綜復雜的調整、實驗測試,以及一些運氣。而成功的算法是一個謎,即使是算法的創作者也不能完全理解,也不能在其他領域自動復制。即使是最準確的模型也會如此脆弱,以至于最輕微的改變或惡意干預都會使它們偏離軌道。
如今的人工智能系統并不具備人類一樣的頭腦,是一種基本的統計封裝,只是比過去的方法更強大、能力更強,這與計算機誕生以來所做的事情相比并沒有什么不同。
在視聽分析等一些領域,深度學習方法具有真正的變革性,允許機器在理解和生成圖像、語音和視頻方面達到精確水平,而這些在幾年前是無法想象的。神經視覺系統可以識別車輛的品牌和型號,即使在遍布武器、旗幟、士兵、槍支的戰場圖片中,可以理解地上的槍,指向空中的槍和指向人的槍之間的區別。它可以估計照片拍攝的地理位置,即它看起來與以往看到的訓練圖像有很大不同。它還可以創建出人性化的新圖像或語音。
這是真正的應用人工智能革命發生的地方,為機器理解開辟了新的模式。
與此同時,使用人工智能進行普通的文本和數字分析并不總能顯示出更高程度的變革。就像它取代的統計機器翻譯(SMT)一樣,神經機器翻譯(NMT)在良好的情況下可以達到類似人類的流暢程度,但在其他情況下卻失敗了。雖然神經機器翻譯(NMT)系統確實可以在學術競賽中獲得更高的BLEU分數,但是當應用于日常的實際日常內容時,其收益并不一定顯著,因為它們會在混亂的理解中混淆不清。
問題在于,神經機器翻譯(NMT)就像其前身統計機器翻譯(SMT)一樣,只是盲目地應用從大量訓練數據中學到的統計模式。神經機器翻譯(NMT)系統只能應用學習模式將一組符號轉換為另一組符號,就像模仿藝術家畫作的孩子一樣,在紙上通過顏色和形狀進行模仿,卻不了解他們想要繪制的內容。與人類翻譯不同,當今的神經模型實際上并不理解它們正在閱讀的概念和思想的深層含義,他們只是像統計機器翻譯(SMT)方法一樣識別符號的模式。神經機器翻譯(NMT)系統在識別更復雜的模式、執行更復雜的重新排序,以及在更大的文本窗口中操作的能力方面具有相當優越的性能,但即使是神經機器翻譯(NMT)系統仍然主要在句子級別或單獨的小塊文本中運行。人們還有很長的路要走,更加完善的神經機器翻譯(NMT)系統可以讀取整個文本段落,將其提煉為它所討論的抽象概念和觀點,然后將其完全從基于思想的抽象表示形式轉換為另一種語言,帶來語境和消除歧義、語境化和框架的知識。
此外,大多數語言缺乏訓練數據意味著,即使是最前沿的神經機器翻譯(NMT)系統仍然像許多語言的統計機器翻譯(SMT)系統一樣失敗,或者遭受同樣的段落不流暢問題,這些問題將會隔一定時間出現,這使得它們的關鍵論點無法被理解。
神經文本處理作為一個整體遭受著過程對結果的影響。企業相信,深度學習解決方案將勝過任何其他解決方案,因此應不惜一切代價尋找深度學習解決方案,卻沒有認識到并非每個問題都適合當前的神經方法。
很多公司為最基本的任務構建深度學習解決方案,例如識別特定人員或提及的公司名稱。當被問及龐大而昂貴的深度學習模型是否優于簡單的關鍵字搜索名稱和一些變體時,往往他們從未真正嘗試過答案,他們只是假設神經元才是前進的方向。如果完全執行最終基準測試,通常表明采用神經方法實際上不太準確,因為它對文本中的拼寫錯誤和語法錯誤過于敏感,缺乏足夠的訓練數據來獲取大多數邊緣情況。
神經實體識別、分類、地理編碼和情感分析都是即使是最前沿的算法也經常難以超越編寫良好的經典方法的領域。關鍵是那些商業部署編寫的并不太好。
大多數用戶匆忙地將自己制作的規則或數據匱乏的貝葉斯模型混雜在一起。實際上,這是一種罕見的經典算法,它是從域向下構建的,而不是從代碼向上構建的。特別是情感算法已經注重由程序員構建的簡單易用的代碼算法,而不是退后一步,與心理學家和語言學家一起工作,以理解人類如何交流情感,并構建工具來捕捉這些現實世界的復雜性和細微差別。
在這種情況下,神經方法可以幫助標準化模型創建并將其強制轉換為更強大的數據實踐,但其好處通常主要來自創建工作流程的更改,而不是神經方法本身的功能。實際上,對于許多公司而言,深度學習方法的最大好處不是來自神經網絡的能力,而是來自當前模型構建工作流程強制執行的以數據為中心標準化的創建過程。
在過去半個多世紀的深度學習革命過程中,人們幾乎把每一項可以想象的機器理解任務都運用到100多種語言的文本和視聽新聞內容上。從神經學習到經典機器學習,再到人工構建專家規則到進行過α測試的各種方法。根據從生產商業應用到前沿研究實驗的一切測試,其結果總是一樣的:神經方法為視聽內容和選擇理解和創建任務提供了巨大的準確性和能力飛躍,但它們可以經常應用于常規文本理解使用精心設計的非神經解決方案,可以使用更少的訓練數據和更強大的穩健性來復制或超越。
問題在于,雖然真正具有能力的深度學習專家比較稀缺,但是能夠構建反映其所使用的數據和場景的強大系統的數據科學家數量更少。簡而言之,神經方法為許多企業帶來了相當大的好處,不是因為使用深度學習,而是因為他們的數據科學工作流程太差,只是專注于算法而不是結果。
如今面臨最大的挑戰,可能是像Alphabet公司的DeepMind這樣的人工智能研究小組的開創性工作之間的巨大鴻溝。與商業部門構建的死記硬背的深度學習系統相比,這些研究小組正在構建可以學習玩電子游戲的工具,并且展示出直覺。使機器能夠推理世界,與外界溝通和理解,快速學習新任務,從示例抽象到更高階的表示,甚至自己來創建,這些都是深度學習方法所特有的令人難以置信的能力。與此同時,這些與死記硬背分類過濾器和實體提取器相去甚遠,它們構成了商業部門深度學習的主要部分。
綜上所述,很多關于人工智能的誤解更多的是一種營銷炒作而不是現實。很多企業急于將人工智能部署到任何地方,并聲稱擁有“人工智能驅動的業務”,但是這些神經部署并不總是比取代的經典系統更精確。在許多情況下,他們往往更糟。神經方法確實改變了視聽理解,但是當涉及到文本理解時,神經方法并不總是代表著重大的飛躍。隨著深度學習的開創性應用最終從DeepMind等應用的研究實驗室進入到商業世界,這可能會發生變化,但是現在,一些企業可能會詢問深度學習是否真的是給定問題的答案,并進行廣泛的基準測試以測試結論是否正確,最重要的是,用戶需要重新思考如何創建軟件系統,以及將神經方法的創造性和嚴謹性被用于更傳統的數據科學工作流程時將會發生什么。