2018年1月28日上午,《麻省理工科技評論》新興科技峰會EmTech China于北京國貿大酒店正式召開。Tomaso Poggio,MIT計算機科學&人工智能實驗室教授發表演講——《深度學習:從煉金術走向化學》。
以下附上演講全文:
今天我想和大家談一下人工智能領域正在發生什么。首先,我想說說我們在人工智能最近所取得的一些成功,尤其是過去五年,以及我們人工智能未來可能在哪里取得突破。然后,深度學習。深度學習有點像我們這個時代的煉金術,但是需要從煉金術轉化為真正的化學。這樣我們才能知道,深度學習在未來到底可以實現什么。
過去五年,人工智能領域最重要的兩個成就是:AlphaGo和自動駕駛。我在這行待得夠久了,因此兩個領域都有我的學生:一個是AlphaGo的Hassabis先生,他是DeepMind員工,現在在谷歌;另外一個就是Moblieye的CEO Amnon Shashua,他現在已經加入了英特爾。
接下來我們可以看一下過去23年機器學習取得了哪些進步。
23年以前,我和Hassabis希望可以把計算機視覺和機器學習進行整合,然后創造出一個學習系統辨別行人。在這個短片中,我們可以看到機器識別出了行人和信號燈,基本上每秒鐘會出現10個錯誤,當時是1995年,所以我們對這個結果還是非常滿意的。
但是,Moblieye后來做到了每30英里只出現1個錯誤,把錯誤率降至當年的百萬分之一,可以看出機器學習的準確性顯著提高。
AlphaGo和Moblieye所取得的進步,背后是什么動因呢?
首先我認為是機器學習的算法,第一是深度學習,第二是強化學習,他們都是來自于認知科學以及神經科學。
深度學習的架構最早是在60年代研究猴子的視覺系統時被發明出來的,從而更好地研究他們大腦在學習時的神經結構,然后一直到Fukushima 提出了首個量化模型,再到20年前現代版的HMAX被提出。這些架構都是一脈相承的——從腦科學到現在的深度學習,本質上都是一樣的層級架構。
從下到上,神經的等級越來越高。這個結構的局部中并沒有很多的連接,每一個高級的神經元只會和下一個等級的神經元相聯系。
2012年我們也開發出了AlexNet,它也是性能最好的一個架構。基于神經科學,我們通過工程學的研究并不斷地發展。這是很重要的,因為我們還沒有真正實現人工智能。
深度學習可以幫助我們解決10%的難題,剩下的90%呢?我的答案是我們可能也需要來自神經科學以及認知科學的研究,我們需要更好地了解人的思維和大腦。這也是我們MIT大腦、心智和機器中心(CBMM)在研究的問題,五年前我們開始開展相關的研究。
我們的使命就是要在理解認知方面獲得新的進步,同時也需要去了解整個智能的架構和智能背后的科學原理。關于智能的科學會幫助我們回答最宏大的問題,了解生命的起源包括宇宙的起源,以及時間的源頭。大腦中智能的產生,是科學現在需要解決的元問題。
CBMM想通過以下三條路徑解決這個問題。
一:計算機科學+機器學習
二:神經科學
三:認知科學
我們會同谷歌這樣的商業公司合作,探索在工程和科學領域合作的可能。
過去幾年中,技術發展和理論發展、包括深度神經網絡領域的發展很顯著。要了解深度神經網絡的運作原理,需要回答背后的三個基本問題:
逼近理論:深層網絡什么情況下會比淺層網絡更有效?
最優化:應該如何設計經驗風險函數?
學習理論:為什么深度學習不會產生過擬合?
這三個問題是機器學習的奠基石。他們的答案很復雜,要解決這種問題,我們需要一開始就思考深度學習的一些技術理論,以及它的局限性。
現在是應用人工智能的黃金時代,因為深度學習及其工程應用,終于幫助我們將傳統的人工智能科學理論應用于了工程實際,而且能夠為我們進行賦能。假如我們可以超越深度學習的理論,可以更好的去了解人類智能的話,我們也可以更加深刻地了解我們人類到底是什么。