1956年,由數學系年輕的助理教授John McCarthy領導的科學家小組齊聚新罕布什爾州的達特茅斯學院,計劃進行一個為期六周且雄心勃勃的項目:創建一種能夠“使用語言、形式抽象與概念,幫助人類解決各類現存問題并自我改善”的計算機。
隨著項目帷幕的徐徐開啟,人工智能(AI)領域也正式出現在世界之上。當時的科學家們認為,“只需要2個月時間加10名研究人員”,就足以解決AI謎團中的核心難題。在第一份AI提案中,赫然寫道“只要能組織一批精心挑選的科學家共同研究一個夏天,我們就能夠在一個或者多個問題上取得重大進展。”
然而經歷了六十多年的探索,真-人工智能的時代仍然遙遙無期。我們仍沒能打造出擁有與人類兒童相近思維與解決問題能力的思考機器,更遑論成年人。但是,探索的腳步從未停歇,突破也在持續來臨——時至今日,人工智能領域已經呈現出人工通用智能(AGI)與人工窄智能(ANI)并立的局面。
通用AI與窄AI之間有何不同?
正如McCarthy和他的同事們所設想,AI代表著一種人工智能系統,有能力學習任務并解決問題,且全程無需人類為其明確指示操作細節。這類系統需要能夠進行推理與抽象,并輕松將已經掌握的知識從一個領域轉移到另一個領域。
研究人員經歷了數十年攻堅,并意識到AI系統確實很難滿足以上提到的所有條件。而能夠模仿人類思維過程的計算機AI這一原始愿景,也被更名為“人工通用智能”。
根據維基百科的說明,AGI是指“一種能夠理解或學習人類方式并完成任意智能任務的機器。”目前,科學家、研究人員以及意見領袖的普遍觀點是,我們距離真正的AGI至少還有數十年的發展歷程。
但在實現這一創造思維機器夢想的持續努力當中,科學家們還是設法發明出各種實用的技術。而窄AI,正是這類技術的統稱。
所謂窄AI,是指那些特別擅長處理單一任務或者特定范圍內工作的系統。在大多數情況下,它們在特定領域中的表現遠優于人類。不過一旦它們遇到的問題超過了適用空間,效果則急轉直下。換言之,它們無法將自己掌握的知識從一個領域轉移到另一個領域。
例如,谷歌下轄AI研究實驗室DeepMind開發的機器人能夠在即時戰略游戲《星際爭霸2》當中屠殺人類選手;而一旦將對抗平臺換成《魔獸爭霸》或者《命令與征服》等其他同類游戲,它的競技水平會立刻下降至智障級別。
盡管窄AI無法全面執行需要人類智能的任務,但在特定場景中仍然非常實用,而且已經在諸多應用之內發揮著自己的作用。谷歌搜索查詢現在可以利用窄AI算法回答問題;窄AI系統會在YouTube及Netflix中推薦用戶可能感興趣的視頻,并在Spotify中按喜好整理出周推音樂列表。
事實上,在大多數情況下,每當我們聽說某家企業“利用AI解決了某些問題”,或者是在新聞頭條里看到與AI相關的消息,他們指的都是人工窄智能。
窄AI技術的不同類型
目前市面上存在的窄AI技術可以大體分為兩類:符號型AI與機器學習。
符號型人工智能(又稱傳統AI,GOFAI)在很長一段歷史時期中都是學術研究的主要領域。符號型AI要求程序員精心定義規則,借此引導智能系統的行為,符號AI適用于那些具備可預測且規則明確的應用場景。盡管過去幾年當中,符號型AI的關注熱度有所下降,但我們目前的大部分應用程序仍然以這類方案為基礎。
機器學習則屬于窄人工智能的另一分支,通過示例建立起智能系統。機器學習系統的開發者負責創建模型,并為其提供大量示例以完成“訓練”過程。機器學習算法將處理這些示例,并建立起通過數據中的數學表示執行預測與分類任務的能力。
例如,經過訓練的機器學習算法能夠從成千上萬條銀行交易操作及結果(包括合法及欺詐行為)中學習知識,并據此預測新的銀行交易活動是否存在欺詐嫌疑。
機器學習一派還包含多種不同風格。深度學習屬于機器學習內的一種特殊類型,并在過去幾年中得到全球各界的關注。深度學習特別擅長執行那些數據內容較為混亂的任務,例如計算機視覺與自然語言處理。
強化學習又是機器學習的另一個子集,大部分游戲機器人使用的正是這種窄AI類型。其核心實質,在于通過反復試驗嘗試解決問題。
我們為什么會長期停留在窄AI階段?
符號型AI與機器學習只能各自反映出人類智能中的一個側面,但卻無法將各個必要部分組合起來,共同建立起涵蓋完整人類智能的AI系統。也正因為如此,我們才長期停留在窄AI階段,再難前進一步。
符號操縱是人類思維過程中的重要組成部分。但是,單靠符號操縱并不足以反映完整的思維體系。我們會在童年時期學到多種技能(走路、奔跑、系鞋帶、搬運、刷牙等等),這些技能徹底融入了我們的血液當中——無需任何形式的符號操縱,我們都能隨時隨地利用潛意識將其掌握。
符號AI系統非常脆弱,開發者需要對其面對的每一項任務做出精確指導,而系統也只能在嚴格符合定義的規則范圍之內運行。
在另一方面,機器學習算法則比較擅長模仿那些符號推理捕捉不到的行為,例如人臉及語音識別,并通過示例掌握人類熟知的各類技能。在這方面,深度神經網絡(深度學習算法中使用的結構)表現尤為出色。其能夠攝取大量數據,并開發出數學模型以表征其中的模式。
但同樣的,人類的學習過程也并不能簡單概括為純粹的模式匹配。例如,我們只需要看過幾張小貓的圖像,就能借此識別出一生當中見到過的形形色色的小貓。對人來說,從意識到什么是貓到準確識別出貓是個一氣呵成的過程,但AI系統還遠做不到、且必須在學習中引入許多符號操縱因素(貓有四條腿、一根尾巴、體表大多布滿茸毛、長著尖耳朵和三角形的鼻子等等)。
符號操縱的缺失,限制了深度學習與其他機器學習算法的功能。深度學習算法需要大量數據,才能達到人類僅通過極少示例就掌握的任務執行能力。具體來講,用于計算機視覺的卷積神經網絡(CNN)往往需要通過成千上萬張圖像,才能完成對各類對象的識別訓練。即使如此,在遇到新的光照條件或者相同物體的不同呈現角度時,這些模型還是會快速敗下陣來。
諸如AlphaGo、AlphaStar以及OpenAI Five等AI游戲系統必須經過數百萬場比賽或者數千小時的訓練,才能弄明白某一款游戲究竟該如何操作。單從訓練強度來看,這一數量已經遠遠超過任何人(甚至十個人)一輩子的游戲時長。
機器學習系統還嚴格受限于訓練示例所涉及的上下文范圍,窄AI一詞也正源于此。例如,無人駕駛汽車當中使用的計算機視覺算法在遇到異常狀況時,例如非正常停放的消防車或翻倒的汽車,很容易做出錯誤的決定。
窄AI之后,下一個時代是什么?
科學家們一致認為,我們目前擁有的任何AI技術中都尚不包含人工通用智能的任何必要部分。更要命的是,大家甚至對AI接下來該往何處去都各執一詞。下面來看擴展人工窄智能的幾種主流思路:
認知科學家Gary Marcus建議應該將基于規則的系統與神經網絡結合起來,建立起混合型AI系統。已經有部分工作示例表明,神經符號AI系統確實有望克服窄AI面臨的數據約束。Marcus寫道,“建立架構的第一步,是將符號化方法的優勢與來自機器學習的洞見相結合,據此開發出更強大的技術,進而從充斥著大量噪音信號的大型數據集內提取并歸納抽象知識。”
計算機科學家Richard Sutton合作撰寫過一本關于強化學習技術的開創性著作,在他看來超越窄AI的解決方案在于進一步擴展學習算法。Sutton認為,人工智能行業的進步主要歸功于“單位計算成本呈指數下降這一持續性趨勢”,而非我們真的找到了將人類知識與推理更好地編碼到計算機軟件中的方法。
深度學習先驅Yoshua Bengio在去年的NeurIPS大會上談到了系統二深度學習算法。根據Bengio的介紹,系統二深度學習算法將能夠在無需集成符號AI元素的前提下,執行某種形式的變量運算。Bengio指出,“我們希望打造出能夠理解真實世界的機器,建立起良好的環境模型,使其能夠理解因果關系,并在這樣的真實環境下采取行動來獲取知識。”
另一位深度學習先驅Yann LeCun在今年的AAAI大會上談到了自我監督學習。自我監督學習AI應該能夠通過觀察世界來學習,而不再需要大量標記數據。LeCun在會上解釋道,“我認為自我監督學習代表著未來。它將讓我們的AI系統,特別是深度學習系統進入一個新的水平,有望通過觀察來了解關于這個真實世界的背景知識,甚至深化出某種認知常識。”
我們如何判斷自己是否跨過了窄AI這道“坎”?
目前,人工智能面臨的一大挑戰,在于人們總會為其設下持續發展的目標。只要還有問題未得到解決,我們就不能盲目斷言關于通用智能的宏愿已經實現。而從另一個角度出發,只要能夠解決所有問題,那么計算機就將擁有真正的人工智能。不過其中的悖論在于,對于機器能夠解決的問題,我們又往往認為該問題的解決并不需要智能。
這方面的典型例子就是國際象棋,這項棋類運動曾被視為人工智能領域的試金石,在重要性方面堪比二十世紀初引發遺傳研究突破的果蠅基因破譯。但1996年,計算機“深藍”成功在棋盤上擊敗了國際象棋世界冠軍卡斯帕羅夫。此后,人們開始認為國際象棋不足以證明計算機是否擁有真正的智能——相反,它是純粹利用計算能力檢查所有可能的棋步,并選擇其中最有利于取勝的選項。這就在原理層面束縛了AI系統的意義,而且目前在特定任務中表現出色的窄AI系統(例如在餐廳中接聽預約電話的聊天機器人)也存在相同的問題。
窄AI的發展,從多方面證明了我們原本認為必須依靠人類智能解決的問題,實際上完全可以拆分成數學方程式加簡單算法的形式。
就在最近,人們開始更多通過更常規、更具一般性的問題衡量AI系統的能力。這方面,我向大家推薦由François Chollet撰寫的《關于智能的度量(On the Measure of Intelligence)》,這篇論文是這位Keras深度學習庫的創造者帶給全人類的又一份寶貴財富。
在論文中,Chollet探討了如何衡量AI系統在解決未經明確訓練或指示的問題方面表現出的能力這個核心議題。在這篇論文中,Chollet提出了抽象推理語料庫(ARC),用于對能力假設做出一系列提問式檢驗。就在今年早些時候,谷歌組織的數據科學與機器學習競賽平臺Kaggle也發起了針對ARC數據集的挑戰項目。
雖然問題難度過高,幾乎沒人能在短時間內攻克難關并拿到資金,但項目的提出仍然給了我們一把衡量AI真實智能水平的重要標尺。從窄AI到能夠與人類相比肩的真-思維機器,我們到底還有多長的道路要走?這個問題的解決,同樣是通往人工通用智能的一級關鍵基石。