10 月 30 日百度公布了 2014 年 Q3 財報,營收較 2013 年同比增長 51.8%,移動收入突破 36%。不過在營收和移動業務的亮點之外,我更好奇的是百度在技術和研發——也即在對未來的投資上面的投入。
財報顯示,2014 年 Q3 百度技術研發投入總計18.32 億元,同比增長 68%。百度在最近四個季度研發投入超過 60 億元。我對百度在技術上的投入有更強的好奇。
從向偏遠和貧困地區提供無線上網的 Google 熱氣球(Project Loop)計劃,到可自動識別交通指示牌、自行前往目的地的百度無人駕駛汽車,這些(暫不成熟卻有未來想象力的)未來產品讓Google、百度吸引了無數注意力。跟那些專注于賺當下的錢、埋頭于不斷開發新應用的同行來說,Google、百度似乎對那些「不務正業」的事情投入頗大,這是為什么? 除了是一家商業互聯網公司之外,Google、百度還將自己視為能產出重大科研項目突破的地方。擁有了機器學習、數據挖掘等領域深厚背景之后,兩家公司相繼推動了無人駕駛汽車、無人駕駛自行車、智能眼鏡(Google Glass,百度 Eye)及 Google 大腦、百度大腦等未來產品的研發和上線。
那么,開發這些在當下看來缺乏利潤空間的未來產品意義何在?似乎每一個用戶、業界人士都在探討,都有自己的觀點,但并沒有人系統的來闡述。
如果用一句話來闡述,「未來產品」是通過技術手段,對當前的產品進行顛覆性地改造;其意義在于用更具有前瞻性的、更加創新的方式,來徹底改變人們的行為和生活方式。比如智能眼鏡運用與醫療、工業的領域,可以幫助醫生記錄病人的體征,在手術中記錄手術流程,對醫生進行行為指導;幫助滿手沾滿油污的工人,在工作中解放他們的雙手,讓他們通過語言指令來調用檢查清單,高效的完成多項任務。無人駕駛汽車,幫助人們實現超遠距離的長途旅行,提升旅行駕駛的安全性,并幫助殘疾人體驗駕駛的便捷和樂趣。
除了能改變人們的生活,未來產品對企業和社會都有非常有利的作用。以企業而言,可以收集很多系統參數和產品數據,用以改善現有產品,同時對未來其他產品的誕生打下數據基礎,并從中獲得商業上的回報。產品中所搜集的大數據,通過深度學習系統的分析,對于改善現有產品的體驗具有重要意義,如百度的搜索、語音圖像識別;Google 的 Google Now;微軟的 Cortana 等等。
比如自 2012 年開始,百度投入了很多資源研究語音搜索,目前語音識別的準確率已經達到了 94%,并被用在了手機百度、百度語音助手、百度手機輸入法等產品當中;百度圖像搜索,圖片搜索準確率達到 80%,可以識別包括寵物、汽車、建筑、衣服等十幾類物品; Google 的語音搜索 Google Now 在最近的測試中,在語義理解、搜索效率和呈現方式上,戰勝了 Siri 和 Cortana,同時它還具備事項提醒,實時翻譯等功能——對了,有一個親身經歷是,今年 3 月份我在美國奧斯汀趕飛機的時候,在登機前一個小時、即將進入安檢大廳的時候,Google Now 自動在我的手機上彈出了登機牌,這樣的體驗甚至比我自己還了解自己。此外,對用戶使用習慣、LBS信息的收集,可以了解用戶的生活圈,興趣偏好,在服務的推送上做到精準直達,這樣所推薦服務的商業轉化率就會更高,遠高于海量向用戶推薦服務的方式。
未來產品拒絕微創新,它提供的產品解決方案目的是解決困擾上百萬甚至上千萬人的問題。比如就社會層面而言,今年八月份,百度推出的基于大數據的經濟指數能為中小企業景氣指數和宏觀經濟指數預測。其中,中小企業景氣指數可以實時的反映宏觀經濟、區域經濟、行業經濟的景氣發展狀態,提前預示中小企業在資金鏈、利潤創造能力、抗風險力等經營狀況;而宏觀經濟指數預測則可以對先行指數、一致指數、PPI、PMI等反映國家經濟發展狀態的宏觀經濟指數進行未來三個月的預測。
據百度方面透露,計算數據來自于覆蓋國人達 95% 的實時搜索數據,每日超 60 億次的檢索請求,這些海量數據背后表達了大量的企業真實需求和用戶行為信息。經濟預測本身并不是新生事物,但是通過海量數據做出幾乎實時的預測,可以為貨幣政策、財政政策、相關產業政策的制定和調整提供參考依據;打破了大企業對數據的壟斷,使中小企業能有的放矢,更有效的組織生產、營銷等要素。
此前有研究人員通過 Google Trends 來預測股市的走勢,因為他們發現 Google 和維基百科的搜索數據可以作為股市動向的預警信號。研究人員將各種話題分類,例如“商業”話題中會包含如「商業」,「管理」,「銀行」等詞匯,研究小組量化了維基百科上每一個字的意思。之后研究人員便通過 Google Trends 來觀測每周數千個關鍵字在 2004 年到 2012 年之間被美國人搜索了多少次。通過持續的觀察和試驗,他們發現人們對政治和商業詞匯搜索次數的增加,表明人們對經濟現狀的擔憂,從而可能導致人們對股票價值失去信心,最終致使股票價格下跌。
當然,未來產品仍然還有許多挑戰,其中深度學習、人工智能是突破的關鍵要素,這也在一定程度上解釋了為什么深度學習對百度、Google 這些企業具有無窮的吸引力。
在硅谷,Google X 實驗室曾經用一萬六千個計算機處理器建造了一個包含十億個節點的神經網絡,利用「深度學習」算法,在沒有人工干預的前提下,模擬人腦觀看一千萬部隨機的 YouTube 視頻截圖,這部機器開始在兩萬個物體的照片中識別出包含「貓」的圖片;百度深度學習研究院(IDL),融合了深度學習算法、數據建模、大規模 GPU 并行化平臺等技術,構造百度大腦,它擁有 200 億個參數,成為世界上最大的深度神經網絡,在今年巴西世界杯小組賽中以 58.33% 的預測準確率擊敗微軟、Google、高盛;微軟深度學習系統 Adam,曾將語音識別的錯誤率降低 30%。近期,微軟也稱 Adam 在評測中已經超越 Google Brain,并比之前的深度學習系統在圖片識別方面快 2 倍,并只使用了相當于之前的 1/30 的計算機。
在國內,未來產品在離我們越來越近。這與百度和 Google 這些技術級企業的投入和研究密切相關。這類公司是以技術起家,這讓他們在互聯網公司中更重視基礎技術和尖端技術的研究。而在移動互聯網這個大數據爆發的黃金時代,他們有意愿、有能力也擁有更好的機會來創造顛覆式的創新,擁抱未來。
深度學習的指導思想是“將計算機科學與神經科學結合”。在領導谷歌大腦項目時,吳恩達曾提到,「我發現工程師(擅長計算機科學)和 科學家(擅長神經科學)之間存在著巨大的代溝。」工程師們想要構建成功的人工智能系統,而科學家們卻仍未能完全理解人腦錯綜復雜的工作機制。很長一段時間內,神經科學并不能夠為想要建造智能機器的工程師們提供答案。經過吳恩達和其他科學家的努力,這樣的局面開始發生改變,美國國家心理衛生研究所(National Institute of Mental Health)主任托馬斯·因瑟爾博士(Dr. Thomas Insel)介紹, 業內已經形成共識,誰能搞明白人腦如何計算,誰就能設計出下一代計算機。
百度深度學習研究院、Google X 實驗室之于未來產品——他們當下的投入和布局,將不斷產生革命性的推動力量——就像當年的施樂帕克研究中心之于現代計算機一樣,創造 the next big thing。