人工智能(Artificial Intelligence)在其短暫的歷史中經歷了不少大起大落。既有著50年代研究人員對發明“和人類一樣聰明的機器”的樂觀判斷,也有著70年代和90年代兩次“AI的冬天”。對于IT界來說,人工智能之前的表現差強人意,投資人和各公司都賠了不少錢。不過,進入2012年,在技術上的種種客觀條件的變化,尤其是云計算的盛行,也許會使人工智能迎來一個真正的上升期。
在本周的一個討論會上,來自MIT商學院的Michael Schrage教授提出了有關云計算和機器學習的問題(Machine learning)。馬克·安得森則表示,機器學習實現人工智能真正的方法恐怕不是教會電腦像人類一樣思考,而是用算法去處理極其大量的數據,而云計算和云存儲將會在這里發揮極其巨大的作用。在說到這個現象時,他舉了一個非常有趣而又吸引人的例子,那就是很多人會把Google當成一個拼寫檢查器來用。我們所說的檢查拼寫不僅僅包括了英語單詞的拼寫,還有中文語法的搭配,成語用法,甚至是一些古詩詞中的用字,以及不斷涌現的網絡流行語,等等。檢查拼寫一直以來都是一個經典的人工智能問題,因為在這個問題之中我們的目的就是要教會電腦像人一樣說話,讓它們學會人類語言的詞匯、語法、句型,然后再拿這些我們教給電腦的規則來檢查我們的語言和語法。
一直以來,專業的拼寫檢查器(spell checker)都沒有達到人們的應用要求,其原因有很多。比如說,人類的語言是極其復雜而且內容繁多的,有非常多的規則需要設計,同一句話可表達不同意思,不同的話可表達相同意思,流行語更新很快,等等。比較起來,目前最先進的拼寫檢查工具不是任何一個專業的工具,而是搜索引擎! 很多用戶大概都有過這種經歷,就是對于一個句子,一個單詞,一句古詩不確定的時候,拿Google或者百度搜一下。有意思的是,不管Google還是百度都不是作為拼寫檢查器被設計出來的,而且他們也沒有專門的“拼寫檢查”功能。之所以這個歪打正著的功能居然這么好用,是因為它收集而且組織了極其大量的信息。搜索引擎能看到所有人們提出的問題,所以如果你在拼寫中或者用詞中犯了一個錯誤,它能通過比對海量數據來預測出你的這個錯誤 – 而結果就是搜索引擎事實上成為了目前為止最先進的拼寫檢查器。
相同的方法和原理在人工智能、預測分析學的很多其他方面都有著應用,比如人臉識別技術,等等。這些應用的基礎只有一個 – 那就是極其大量的數據。從這個角度上說,云存儲和云計算帶來的大量數據也許會對類似的應用帶來無限的機會,怪不得Peter Thiel前段時間又一反傳統觀點的預測人工智能的黃金時代剛剛開始。把Google當拼寫檢查器用 –這個有趣的現象值得我們好好去觀察和思考,也許海量數據真的會帶來人工智能的新時代。