摘要 : 百度的目標是引領全球互聯網創新,有了百度美研這個“最強大腦”,百度離這個目標也就更近了一步
1月30日,借百度the Big Talk的東風,老冀等一群媒體自媒體人走訪了位于硅谷的百度美國研究院。
百度美國研究院在硅谷山景城靠近101公路的大樓里,旁邊是微軟、摩托羅拉,離谷歌也很近
目前百度還沒有獨立的辦公樓,不過隨著人員的急劇擴張,很快就要有了
百度美國研究院前臺
可升降的辦公桌
吃的喝的應有盡有
中國公司在硅谷成立研發機構,最重要的問題就是招到最NB的研發人員,給他們最具挑戰性的項目。
2011年的時候,包括董事長兼CEO李彥宏在內的百度高管們一致認為,到了進軍硅谷的時候了。七月份的時候,百度美國研究院(簡稱“百度美研”)在規格的庫比提諾建設了第一個辦公室,據說旁邊的辦公室就是當年蘋果公司從車庫搬出來之后的第一個辦公室。
(百度董事長兼CEO李彥宏)
百度美研的第一個員工是人力資源總監,他的主要職責就是招人,招募到的第一個員工是James Peng,他是資深架構師、大數據和云計算專家,曾經在谷歌廣告團隊工作過8年內。談及加入百度美研的原因,James說道:“我是中國人嘛,一直都在關心中國互聯網的發展,如果能夠到中國公司挺好的。”
、
(James Peng)
另一位曾經效力于谷歌廣告團隊的大數據和云計算專家呂厚昌也在不久后加入百度,他曾經舉家遷回北京,深感國內生活真是比美國要豐富多彩得多,不過后來又回到了美國,主要還是由于天氣的原因。的確,與帝都時不時的霧霾相比,硅谷永遠湛藍的天空更有利于健康。
(呂厚昌)
庫比提諾的辦公室只能坐20多人很快就滿員了,于是百度美研搬到了如今的山景城,占據了其中一棟辦公樓的一層。這里顯然也是人才聚集之地,左邊有摩托羅拉、右邊接亞馬遜、上谷歌下微軟,呂厚昌開玩笑地說,百度希望做到“上下通吃、左右逢源”。
由此,百度美研進入了2.0階段,人員規模也急劇擴張到了100多人,他們希望打造最創新的環境,吸引全球最高端的人才,做最有挑戰性的項目。
百度美研吸引到了吳恩達的加入。這位香港人是斯坦福大學計算機系教授,也是國際人工智能方面的權威,他曾經領導過“谷歌大腦”項目。如今加入百度,開始幫助百度打造“百度大腦”。吳恩達如今在百度擔任首席科學家,負責百度的整個研究體系。
(吳恩達)
與吳恩達結伴而來的是另一位斯坦福大學的計算機博士后Adam Coates,他目前負責百度的人工智能實驗室。在此之前,Adam曾經訓練出了世界級最大的人工神經網絡,并參與了無人駕駛直升機及機器人的感知系統。百度美研的人開玩笑地說,做無人駕駛汽車百度沒有谷歌快了,也許將來要做無人駕駛直升機的時候百度比谷歌還要快一些。
(Adm Coates)
來自谷歌的專家也不少。除了James Peng和呂厚昌之外,百度美研總經理鄭子斌曾經擔任過谷歌上海研究院總監,負責移動搜索技術研發的總監王京傲則是谷歌安卓系統的初創員工。
(王京傲)
此外還有不少牛人,如深度學習專家徐偉、異構高性能計算專家吳韌、數據中心建設管理專家Ali Heydari。值得一提的就是這位Ali,他一直在搞數據中心方面的工作,據說是Facebook數據中心的第二名員工,Twitter數據中心的第一人。
(Ali Heydari)
百度美國研究院(簡稱“百度美研”)先后從谷歌、Twitter、Facebook以及斯坦福大學招到了一大批牛人,這批牛人到底又做了哪些牛的事情呢?
如果說百度北京研發是主力部隊的話,百度美研就是特種部隊,雖然人數不多,但是威力很大。在過去兩年里,百度先后頒發了8個“百度最高獎”。這個獎項是百度董事長兼CEO李彥宏提出的,獎勵對象為十人以下的小團隊,鼓勵小團隊辦大事、做重大創新。每個獲獎的團隊都能夠獲得高達100萬美元的獎勵,也就是說每個人至少能夠拿到10萬美元的獎金。
2013年百度頒發了兩個百萬大獎,其中有一個是發給百度美研的;2014年發了6個百萬大獎,其中有4個項目百度美研都有參與。這也充分說明,百度美研的研發實力已經得到了整個公司的充分認可。
具體來說,百度美研主要做三個層次的研發:
底層是開放云,包括低能耗數據中心、超大規模分布式架構、新一代智能自動化運維、超強云安全。
百度在山西陽泉建立了一個超大規模的數據中心,美研如今就參與了很多,建設了單集群超過10萬臺服務器,還部署了世界首例大規模商業化ARM服務器,以及世界首例支持深度學習的GPU計算環境。整個數據中心做到了節能環保,最佳能效PUE小于1.3,而目前主流的數據中心的PUE仍然在2.0左右。
中層是數據工廠,包括新一代數據庫管理與查詢技術、大數據挖掘機。
百度利用自己的大數據技術,做了春運遷徙趨勢、城市旅游預測、景點舒適度預測等。還有一個比較有意思的就是百度在2014年世界杯期間做過比賽結果預測,結果16強預測對了13強,16強淘汰賽也全部命中,準確率高于谷歌、雅虎、高盛、微軟等跨國公司。有意思的是這個項目的產品經理也是個球迷,他沒有根據百度的預測數據而是根據自己的經驗下了注,結果既輸了錢,還被百度美研的其他同事笑話。
百度美研還做了個“百度天眼”系統,用戶輸入飛機的航班號,能夠查到飛機飛行的高度、所處位置等各種關鍵數據,還以飛行員駕駛艙的儀表盤的形式直接展現出來。這里面同樣用到了不少的大數據分析技術。
上層是百度大腦,包括深度學習、超大規模機器學習、大規模GPU并行化平臺。
例如目前語音識別技術已經比較成熟了,但是如果遇到了噪音環境,識別率就會大幅度下降。百度美研的Deep Speech則采用了深度學習技術,取得了突破性的進展。如今,Deep Speech在安靜環境下的英語語音識別能力與Google API不相上下,而噪音環境下則大幅度領先。
百度美研的Deep Iamge圖像識別也取得了很大的進展,已經能夠識別出一頭身上披滿了衣服、背上還坐著兩個人的印度大象,識別能力已經接近人腦的水平。
正如李彥宏所說,百度的目標是引領全球互聯網創新,有了百度美研這個“最強大腦”,百度離這個目標也就更近了一步。