8月30日消息,福布斯網站對加盟百度人工智能實驗室的吳恩達進行了專訪。文章指出,招納吳恩達,體現了百度希望通過研發世界一流技術,將自身打造為世界前列的創新型公司的愿景。在以下訪談中,吳恩達透露了他將如何幫助百度實現這一愿景。
以下為文章主要內容:
今年5月百度在硅谷創立了人工智能實驗室,并將吳恩達納入麾下,任命為百度首席科學家。作為斯坦福大學計算機科學教授,吳恩達曾是GoogleBrain項目的負責人,并聯合創建了在線教育初創企業Coursera。讓百度成為國際化企業的發展規劃中,吳恩達不失為核心人物。
問:你是如何對人工智能產生興趣的?
答:過去我只是認為,讓機器具備人工智能是再酷不過的事。高中暑假期間,我在新加坡國立大學做人工智能方面的實習生,任務是編寫神經網絡。它是深度學習算法的雛形。我覺得編寫出能夠自我學習并做出預測的軟件是很有意思的。
如果我們能夠讓電腦更加智能,并更好地理解這個世界和環境,我們可以讓許多人的生活變得更美好。正如同工業革命把我們從體力勞作中解放,我認為人工智能也存在巨大潛能,未來能夠讓我們擺脫大量單調重復的腦力勞動。
問:曾經有段時間,由于進展不順,你對人工智能喪失了興趣,是嗎?
答:人工智能的遠大前景是,機器總有一天將演變成像人類那樣,能夠完成一些具有自主智慧的任務。我剛進入斯坦福大學時,并不認為這種前景是可行的,因此當時有點困惑。人類的智慧或許是依賴某種學習算法,這是有據可依的。因此,我認為或許我們可以模仿人類大腦,建立更像人腦的智能,從而迅速取得進展。這些理念存在已久,但人工智能專家和人腦啟發軟件商Numenta的聯合創始人杰夫 霍金斯(Jeff Hawkins)為普及這些理念做了不少貢獻。
問:真正實現這些設想,你當前的進展如何?
答:我們與真正的成功距離遙遠。我們面臨很多問題。其中之一就是達不到應有的規模。當前我們對圖像的處理規模遠遠不足。其二,我很肯定我們還未摸索出正確的算法。
問:但為什么近幾年人們又重新燃起了對人工智能的興趣和關注?
答:大約在四年前,2010年底,我們已經摸索出了許多算法,并意識到要推動人工智能技術更上一層樓的最大瓶頸是規模。如果我們使用現在的電腦運行20世紀80年代編寫的軟件,效果比使用那個年代的電腦要好很多。
因此2010年年底,我在硅谷尋求可能擴大算法規模的途徑。谷歌擁有很多電腦,因此我在谷歌啟動了一個項目,利用這些算法打造了規模超乎以往的神經網絡。現在回想起來,這個項目取得成功的關鍵在于研發團隊所接受的指令很單純:建立盡可能大的神經網絡。
問:你是指2012年Google Brain項目,當時該項目的神經網絡成功地識別出貓的圖像。
答:對。谷歌的神經網絡竟然能夠自己發現貓的定義,非常了不起。從來沒有人告訴它什么是貓。那是機器學習的一個里程碑。這對許多公司,如Facebook、百度等等,都具有啟發作用。
問:對這些公司而言,這一項目引人注目之處體現在哪里?
答:大多數具有經濟效益的應用,到目前為止僅僅是從經過標記的數據進行學習。以語音識別為例。百度和谷歌已提高了語音的識別效果,他們依據的理論基礎是,深度學習算法可以接納海量的、轉錄為文本的語音數據。這就是經過標記的數據。由此我們可以訓練神經網絡進行預測。
從長遠來看,還有種不同類型的深度學習,我對此感到很興奮。它被稱作無監督學習(unsupervised learning),是指從未經標記的數據展開學習,這更接近人腦的學習方式。Google Brain項目對貓的識別就是這方面的例子。我們曾經讓神經網絡連續一星期觀看YouTube的視頻,并且不作任何提示。一周后,我們做了測試,看看它學會了什么。結果它學會了識別人臉、貓臉和其他一些事物。從某種程度上,這是人工智能的一項重大進展。當前,監督學習是促使深度學習技術產生經濟效應的重要功臣。而無監督學習與它不是同一概念。
問:你為什么看好無監督學習?
答:原因之一是,無監督學習最接近動物和嬰兒的學習方式。如果想讓當前的神經網絡學會識別汽車,我們的做法是尋找5萬張汽車圖片,并把他們標記成汽車,再將這些標記數據輸入到監督學習算法中。而孩子如何學會認識汽車呢?沒有哪對父母會弄來5萬輛汽車的圖片。大多數神經科學家相信,大多數動物和孩子的學習僅僅是通過融入世界、親身體驗世界完成的。如果我們能在這方面取得進步,就能讓神經網絡系統更好地理解圖像。
第二個原因在于,對于某些依賴監督學習的應用,我們能夠提供的數據有限,從而限制了它的發展潛力。例如,醫療成像方面,全國進行的X射線掃描次數畢竟有限,因此能夠得到的圖像數據也受到限制。
問:現在就職于百度實驗室,你關注的焦點是不是無監督學習?
答:它是初期的重要事項之一。無監督學習面臨更多困難,前人的成功經驗更少,而且不知道正確算法是什么。
問:如今存在一種趨勢,即人們傾向于研究移動設備的計算和通信。此外,感官數據也在呈現爆發之勢。這兩個因素是否引發了人們對人工智能的熱潮?
答:還有其他因素。大數據的發展源于兩個趨勢。第一,社會數字化的日益深入,衍生出電腦能夠處理的電子數據。第二,存儲和計算成本不斷降低,最終使存儲和處理所有這些數據的費用降至可承擔的范圍內。如果社會數字化持續發展,存儲和計算成本繼續下滑,大數據最終會發展成為一種潮流。
問:對于百度人工智能實驗室,你短期或中期的具體規劃是什么?
答:百度擁有三個實驗室,兩個北京的實驗室已初具規模,而位于硅谷的人工智能實驗室大部分是空蕩蕩的,才剛剛起步。我們招募新成員的速度很快,一周就招進一名成員,到今天為止,我們已經招了6個人。目前為止,他們都來自硅谷,而且都接受了我們發出的offer。我們還同硅谷以外的少數人接觸,這需要更多的時間。我們還有很多工作要做。
問:對硅谷人工智能實驗室,你心中是否已畫好藍圖,例如,是否會效仿貝爾實驗室、施樂帕克研究中心、谷歌或微軟?
答:此前我曾與這些實驗室的主管交談過。今天早上我會見了SRI實驗室的比爾 馬克,之前也與許多相關領域的人交談,如施樂帕克研究中心的前主管。我曾在Google X實驗室工作。很久以前,本科期間和博士學位攻讀早期的每年夏天,我都在AT&T貝爾實驗室中實習。不斷向他人學習、態度謙遜是很重要的。
問:一個成功的實驗室最重要的因素是什么?
答:團隊文化。
問:從一開始就要正確定位,這點很重要。如果一開始就走偏方向,要糾正是很困難的。你是怎么看?
答:初期過后,即使要做出些許改變也是很困難的。最關鍵在于,任務是什么。我所任職過的所有機構都以任務為主要動力。Coursera的使命是讓每一個人享受教育,因此我們決定要實現這一任務的最佳途徑是創建Coursera這家公司。現在,我面臨的任務是通過人工智能技術改變世界。而我有種強烈的感覺,要實現這一點,最有效的方式是加盟百度。
問:為什么選擇百度?
答:百度已經擁有非常先進的深度學習技術。它的深度學習實驗室負責人余凱是深度學習方面的專家。深度學習對百度的核心產品,如網頁搜索、廣告、語音識別、光學字符識別等等,具有重要意義。李彥宏對人工智能抱有很大的熱情。
我加入百度有三個原因。
其一,人工智能是一項資本密集型技術。要取得進展,則需要數據和計算機資源的支持。數據比計算機資源更難獲得,但兩者缺一不可。
第二是靈活性。作為一個大企業,百度擁有著令人難以置信的靈活性。舉個例子,余凱想要創建一個圖形處理器集群,在做完決定后,很快就付諸實踐了。
第三就是員工的積極性。百度的工程師工作非常賣力。
問:在百度你打算如何展開未來的工作?除了互聯網應用以外,是否會投入對機器人、無人駕駛車等類似產品的研究?
答:最初,我們只打算把焦點放在技術上。通常我傾向于先以產品為立足點,再考慮技術。縱觀硅谷,大多數失敗不是因為解決不了困難的技術問題,而是因為最終發現,費心費力解決的問題其實根本無人問津。
深度學習這項技術很不同,它在百度的許多產品中都已得到應用。人工智能對許多事物都具有重大意義。因此我不必擔心我們的研究內容對當前或未來的產品是否具有實用性。
問:你將如何利用百度的技術基礎設施?是否需要建造一些新的設施?
答:我在摸索如何利用當前的基礎設施和開發工具使深度學習團隊能夠高效地產生新想法并進行測試及學習。例如,許多語音識別實驗的實施大約需要一周。如果一周后才能獲得結果反饋,就很難高效地進行學習。如果將時間減半,就能使團隊的效率翻一番。
問:未來可能會研發出什么樣的新技術?
答:我希望能夠使百度當前的深度學習應用得到持續改進,如搜索、廣告、語言翻譯、光學字符識別和語音識別。
技術的進步分為兩種。一種是漸進的,這種進步會受到人們的歡迎。例如,如果我們能夠把網頁搜索的性能提升5%,許多用戶都將從中受益。
問:另一種呢?
答:另一種技術的進步是突破性的,它將推進前所未有的新應用的誕生。例如,如果語音識別技術進展到能夠無障礙識別人類語言的程度,那么它將創造一種全新的手機互動模式。試想一下,如果我們在開車,哪怕車內很吵,我們仍可以通過向手機輸入語音來向朋友發短信。這在現在根本無法實現。
如果我們能夠真正解決語音識別問題,我想圍繞語音界面對手機進行重新設計。或許未來移動設備上的email應用只需兩個按鈕:回復和刪除。這只是我的想法,不一定可行。但這說明了,一些核心技術的突破將使人們的生活產生巨大的變化.