在北京舉辦的世界科技創新論壇上表示,作為經濟學理性預期學派的領袖人物,薩金特表示:人工智能其實就是統計學,只不過用了一個很華麗的辭藻,其實就是統計學。好多的公式都非常老,但是所有的人工智能利用的都是統計學來解決問題。
對于這樣的觀點,從事人工智能科學研究的科學家們表示不能完全贊同。阿里巴巴達摩院機器智能技術實驗室主任金榕就認為薩金特的說法是片面和不準確的。
金榕在加入阿里巴巴達摩院之前,是前美國密歇根州立大學終身教授,曾獲得過美國國家科學基金會NSF Career Award——有超過200位諾貝爾獎得主都獲得過這個獎金的資助。
在接受澎湃新聞(www.thepaper.cn)專訪時,他表示:“這位宏觀經濟學家也許是習慣了用統計去尋找經濟的因果關系,因而認為AI也是這樣。即使是他提到的動態規劃(dynamic programming),也不屬于統計學范疇。除了統計,AI中的‘學習’、‘推理’和‘決策’中還使用了代數、邏輯、最優化等許多其他學科知識與方法。此外,有了算法后如何有效實現也非常重要。所以單純說AI就是統計學,或者說“所有的AI都是利用統計學來解決問題的”都是片面和不準確的。”
同為達摩院科學顧問的AI學者印臥濤教授也表示,“統計學是AI若干基礎之一,遠不是全部。AI是一個綜合學科。”
在金榕看來,要想準確定義人工智能,首先需要知道什么是人工智能背后的核心技術。“現在人工智能技術的成功背后,是基于對海量數據的學習,因此大量的大數據處理、優化以及分布式計算基礎設施都扮演了非常重要的角色。此外,AI還涉及到一個關鍵因素,就是如何實現最優的智能決策(例如AI打游戲)。一些理論和實證研究已經發現,神經網絡就非常善于在復雜的條件下做出最優的決策。神經網絡也不是統計學范疇。”金榕表示。
其次,盡管不認同薩金特對于人工智能其實就是統計學的表述,但金榕贊同了薩金特演講中提到的人工智能通才以及交叉學科研究是推動當下人工技術進步的關鍵之一。
至于下一波人工智能技術的躍遷需要依賴于哪些領域和學科,金榕認為來自AI芯片、量子計算這些全新的計算基礎設施算力的巨大提升。此外還有神經科學的一些重要突破,可能將揭示大腦中神經元如何處理信息與做出決策的,這對人工智能的發展也有重要意義。
以下為澎湃新聞對金榕的專訪:
澎湃新聞:托馬斯·薩金特認為,人工智能其實就是統計學,只不過用了一個很華麗的辭藻,其實就是統計學。好多的公式都非常老,但是所有的人工智能利用的都是統計學來解決問題。”如何評價這種“AI就是統計學”的觀點?
金榕:這位宏觀經濟學家也許是習慣了用統計去尋找經濟的因果關系,因而認為AI也是這樣。即使是他提到的動態規劃(dynamic programming),也不屬于統計學范疇。
除了統計,AI中的“學習”“推理”和“決策”中還使用了代數、邏輯、最優化等許多其他學科知識與方法。此外,有了算法后如何有效實現也非常重要。所以單純說AI就是統計學,或者說“所有的AI都是利用統計學來解決問題的”都是片面和不準確的。
在這里我們首先需要定義什么是人工智能背后的核心技術。現在人工智能技術的成功背后,是基于對海量數據的學習,因此大量的大數據處理、優化以及分布式計算基礎設施都扮演了非常重要的角色。此外,AI還涉及到一個關鍵因素,就是如何實現最優的智能決策(例如AI打游戲)。一些理論和實證研究已經發現,神經網絡就非常善于在復雜的條件下做出最優的決策。神經網絡也不是統計學范疇。
還有,人工智能在計算機視覺、語音識別等領域取得的突破,還得益于硬件的日趨成熟。類似智能音箱天貓精靈、Echo的成功不僅來自于成熟的語音識別算法,也源于麥克風陣列等硬件設備變得越來越可靠。
那如何比較準確的表述統計學和AI的關系呢?應該說,統計學是人工智能若干重要基礎之一,但遠不是全部。就像我上文提到的除了統計學,AI的核心能力還來自于數學(博弈論、數值分析、邏輯學等)、運籌學(優化)、計算機科技(分布式計算、并行計算、CPU、NPU)、神經科學,甚至心理學。
澎湃新聞:在托馬斯·薩金特的演講中也談到了交叉學科研究推動的科技進步,你是否認同?在這波深度學習為推動力的AI浪潮中,哪些學科的交叉起到了推動作用?
金榕:這一觀點我很認同,這也是很多學者的共識。就像我上面提到的,AI不是獨自成長起來的。1956年的達特茅斯會議(Dartmouth Conference)被學術界公認為是人工智能的起源。今天有人說現在是人工智能的春天,其實這都源于我之前提到的一系列技術的發展與進步。特別是我剛剛提到的硬件,諸如麥克風陣列技術的成熟對語音識別的發展起到了重要作用。還有超強的算力,不論是GPU或者是云計算,都給我們帶來了強大的計算能力和靈活度。我們在自然語言對話機器人的開發中,還會應用到許多心理學知識。所以說人工智能的繁榮是諸多學科交叉相互影響,共同促進的結果。
澎湃新聞:我們知道人工智能的概念提出已經60多年了,許多算法和模型在幾十年前就曾提出了,但在過去的發展中,礙于計算力和數據的局限,此前的發展并沒有像如今這樣迅速,這是不是從側面印證人工智能也算是統計學的一種?
金榕:計算力和數據的增長是人工智能發展的必要條件。AI的發展還要感謝Hinton,LeCun, Bengio(編注:這三位被學術界譽為是人工智能、深度學習領域的三巨頭、權威學者)等研究者的長期堅持。當然統計學也在發展,但由于深度學習的迅速發展,它們反而變得沒有以前那么重要了。
除了統計學,對現在人工智能發展起到舉足輕重作用的,神經網絡的一些研究工作,也是在50年前進行的,但它被廣泛應用是從2010年后開始的。在2010年前,許多上一代機器學習成果的確是基于統計學的,他們被歸類于統計機器學習。但技術是持續進步的,近幾年推動人工智能進入發展快車道的深度學習技術,并不能歸因于統計學。
澎湃新聞:這一波的人工智能發展浪潮繞不開AlphaGo的出現,它的開發和統計學有直接關系嗎?
金榕: AlphaGo使用了蒙特卡洛樹搜索、神經網絡、增強學習等方法,因為算法規模大,所以采用了分布式計算來實現。棋力更強的AlphaGo Zero沒有使用人類數據,而是從自我博弈中學習。所以這更說明AI遠比統計學來得廣泛。所以推動這一波AI浪潮的正是神經網絡的迅速發展,以及能夠讓大量數據發揮作用的算法和算力。
澎湃新聞:下一波大的AI技術躍遷,您覺得會有賴于哪些領域、學科的交叉研究成果?
金榕:我認為首先可能來自于AI芯片、量子計算這些全新的計算基礎設施對算力的巨大提升上。此外還有神經科學的一些重要突破,可能將揭示大腦中神經元如何處理信息與做出決策的,這對人工智能的發展也有重要意義。
澎湃新聞:那么如果要跟大眾普及人工智能概念的話,你會如何定義?
金榕:我認為智能化的目的,不是讓機器像人一樣。上一個世紀,在工業時代,我們基本上把人變得越來越像機器,而未來我們真正應該走的道路是,讓機器更像機器,人更像人。我們發明了機器,不一定要機器按照人的思考。機器要有自己的學習方式、思考的方式、解決問題的方式,所以我們提出“機器智能”。機器智能不應該是,讓機器人復制人類的智能,而是發展出自己獨特的智能。我們應該讓機器做人類做不到的東西,讓機器去發展自己智能的力量、尊重機器、敬畏機器。所以在阿里我們是以“機器智能”為目標。
舉幾個例子,諸如人工智能客服,它能7*24小時的工作,對海量用戶的接待能力遠超人類。人工智能應用于城市大腦,通過智能決策和管理能大幅縮短交通擁堵時間,甚至提高救護車到達現場的時間。AI在工業領域的應用,諸如將計算機視覺應用于產品質檢,已經為許多制造企業節省了數十億元。這些都是AI比人類更擅長的領域。而在藝術、文學等創造性工作上,人工智能可能永遠無法替代人類。
澎湃新聞:有一種觀點認為算法、計算力和數據是人工智能技術能否成功的三個關鍵,你是否也這樣認為?在這三點上,您認為阿里目前最大的優勢在哪里?短板又是什么?
金榕:歷史上人工智能經歷了多次黃金時期。到了今天,我們迎來了新的一波熱潮。
那么這次的人工智能熱潮有哪些不一樣的地方呢。就是由于我們在算法、計算力、數據上都有了重要突破。
首先人類首次擁有了超強的計算能力,不論是GPU還是云計算。給我們帶來了強大的計算能力和靈活度。這點阿里具有很大的優勢。阿里云在中國擁有最大的云計算服務,同時我們也在積極探索量子計算。
其次,也是很重要的一點,就是大量的數據的產生。海量的數據使AI模型的大規模訓練成為可能。阿里巴巴積累了海量的數據與應用場景,這些數據將成為阿里在人工智能領域快速突破的基礎。最后,就是算法領域的突破。深度學習等新技術已經在各個領域得到廣泛應用,比如計算機視覺、語音識別、自然語言處等,多點開花。
阿里也在算法領域做了很多探索。諸如在語音識別領域,阿里推出了新一代語音識別模型——DFSMN,不僅被谷歌等國外巨頭在論文中重點引用,更將全球語音識別準確率紀錄提升至96.04%(基于世界最大的免費語音識別數據庫LibriSpeech)。而在機器翻譯領域,在此前結束的WMT2018國際機器翻譯大賽上,達摩院機器智能-NLP翻譯團隊打敗多個國外巨頭與研究機構,在所有提交的5項比賽中,全數獲得冠軍。這5個項目包括英文-中文翻譯、英文-俄羅斯語互譯、英文-土耳其語互譯。短短一年時間,我們已經在20多個各領域的國際人工智能大賽上獲得冠軍。