在谷歌2015年Q3財報電話會議上,CEO皮查伊(“劈柴”)大力強調谷歌在未來會持續加大對機器學習和人工智能方向上的投入。
今年10月份,在中國,谷歌自己,而非其風險投資部門(Google Capital和Google Ventures),剛剛在中國投資了人工智能創業公司“出門問問”,這在谷歌的投資史上很少見。
其實,結合這家公司的核心技術-人工智能語音交互技術以及谷歌在人工智能上的某些動作,這輪投資順理成章。
無獨有偶,這一年中,微軟加大了對小冰、小娜的投入,蘋果加強Siri的等人工智能產品的研發,Facebook,亞馬遜…國內,百度邀人工智能領域頂級專家吳恩達加盟,加大研究院組建力度,推出度秘、小度機器人...
這股投資 源自AI從感知到認知的跳躍
人工智能和基因相關技術、納米技術被稱為21世紀最有前景的技術,可謂吹了很久。但為何偏偏這一輪,巨頭加倍投資?
一方面我們可以說是巨頭們怕在這一輪投資熱潮中落后,豪賭未來;但更重要的原因是,“從感知到認知”,人工智能的“機器學習”理論出離“紙上談兵”的階段,可以被真地應用到各方各面了。
“機器學習”等新潮詞早在一二十年前提出,但不同以往的是,學術理論終于有了被實現的資源基礎。近期由于硬件的發展與大規模分布式計算的成熟,使得之前曾經遇冷的機器學習,重新獲得學術界與工業界的注意。而“機器學習”相關算法也確實沒“丟人”,在解決一些領域中的問題時表現很優異。比如這幾年炙手可熱的語音識別技術,就因為“深度學習”的廣泛使用,有了約30%的改進幅度。而DNN(Deep Neural Network,深度神經網絡)、LSTM(Long - Short Term Memory,長短期記憶人工神經網絡)等算法,在語音識別、語音合成、甚至語義理解等方面也得到了越來越多的應用,對各項技術都有或大或小的改進。
人工智能(Artificial Intelligence),即AI。機器學習(Machine Learning)作為人工智能的一部分,是對能通過經驗自動改進的計算機算法的研究。一般,機器學習分為監督學習、半監督學習和增強學習。主流算法“監督學習”類似于學生在老師指導下學習并成為正直有用的人,人工智能在工程師的指導下成為可控有用的程序。
Google和出門問問 機器學習算法正被應用
要看人工智能的機器學習算法是不是鼓吹,還要看它是否可以提高生產效率,或者徹底解放勞動力。如某個名人所說:“92年中國缺吃少穿,創業要解決的問題是把那些生產出來,2015年社會有極大的浪費,創業要解決的是效率的提高。”
以Google為例,這個有著超過BAT市值總和的互聯網巨頭的主要產品搜索、郵箱都使用了機器學習算法。
首先是搜索。在用戶搜索時,谷歌會記錄用戶搜索、點擊行為,并將記錄納入大數據。此時,使用了“機器學習”的搜索引擎系統能夠習得“特定搜索行為之下,哪些網頁更相關”,從而使搜索結果更優。另外,在用戶搜索行為中,語音搜索的比例正逐漸增高,而語音搜索過程使用的語音識別服務有大量的“機器學習”算法。
語音識別的基本原理是將信號處理成片段,然后利用聲學模型和語言學模型,把聲音信號在線解碼,找出最匹配的、概率最高的文字序列。聲學模型和語言學模型訓練是提升識別率的關鍵。各家的語音識別系統在訓練聲學模型時多采用的名為RNN(Recurrent neural network,時間遞歸神經網絡)和DNN的神經網絡算法,而在訓練語言模型的時多采用統計學習算法和RNN。
除了搜索,谷歌的Gmail郵箱也沒少使用“機器學習”算法。垃圾郵件讓人討厭,而使用了機器學習算法的Gmail已能夠很好的分辨出垃圾郵件。除了自動分辨,用戶的手動標示也可讓反垃圾郵件的機器學習系統進化,更好的過濾垃圾郵件,提高體驗。
谷歌這個“國外巨頭”證明了“機器學習”算法在“搜索、郵箱”這種“較軟”的服務上的應用價值,而出門問問這家國內初創公司提出了較好的人工智能與可穿戴設備的軟硬結合方案。他們于今年7月推出了一款名為Ticwatch的智能手表,其主打的核心技術——語音搜索服務使用了與谷歌相似的機器學習算法。語音搜索要依次完成語音識別、語義理解、垂直搜索并返回結果等工作。在語義理解中,明確用戶搜索意圖是關鍵,而使用了DNN等機器學習算法的AI系統對自然語言的“理解力”有很大提高。
除了上面提到的幾個人工智能分支技術,還有比較重要的TTS(語音合成)技術也大量使用了機器學習算法。TTS需要對聲音的停頓、語氣、韻律、口型等聲學參數的模擬,除了使用HMM(隱馬爾可夫統計模型)、決策樹等傳統算法,也常使用基于DNN、LSTM的機器學習算法。
人工智能開始“思考”
我們可以想象得出,隨著機器學習理論的發展,人們在語音的輸入與輸出(語音識別與合成)、計算機視覺(圖像處理)、語義理解、垂直搜索等技術上會不斷有所突破。與此同時,在智能可穿戴設備、虛擬現實設備、智能車載機器人等硬件方面,以及游戲、電影等內容方面,都會因為高層次AI而出現令人激動的新產品。
明白了人工智能的潛在商業價值,我們也就不難明白為什么谷歌、蘋果等巨頭加大對人工智能的投入,甚至會在公司所有產品線中,重新定位("re-thinking" )人工智能的角色了。
從感知到認知,我們已經處在人工智能開始認知的階段了。雖然這還只是淺顯的、算不上思考的、基于大數據的認知,但“真AI”已然走在路上。