百度AI技術已成“屠榜”高手
就拿人臉檢測技術來說,百度早在2015年就通過DenseBox算法,刷新了FDDB和LFW兩個公開數據集的記錄,保持世界第一并保持了一年。人臉識別技術是機器視覺與生物識別的交叉技術,人臉檢測是人臉識別的第一步——在圖片或者視頻中找到人臉并精確定位。如果是自拍照自然很容易,目前美圖軟件、智能手機都可以做到,不過很多照片或者視頻中有大量的人像,而且可能有姿態、遮擋、光線、環境、模糊、失焦等不利因素,因此人臉檢測并不容易,要機器達到人眼水平很難。
目前,在所有AI技術中,人臉識別應用最為廣泛。自拍、解鎖、實名制校驗,甚至支付,都能用人臉識別來完成,治安、零售、教育、公益等行業也在大量應用人臉識別技術。百度在人臉檢測上的不斷打破記錄,體現的是百度AI技術的實力,人臉技術只是百度AI技術的一部分(當然,也是很重要的一個技術),百度在自然語言處理、機器視覺、語音交互、知識圖譜、機器翻譯等AI技術上都有布局,且成績斐然。
今年2月,美國《麻省理工科技評論》揭曉的2018年“全球十大突破性技術”(10 Breakthrough Technologies 2018)中,百度成為唯一入選的中國公司,被列為實時語音翻譯領域的關鍵玩家,百度也是唯一一家連續三年入選該榜單的中國公司。
同樣是在2月,百度自然語言處理(NLP)團隊研發的V-Net模型以46.15的Rouge-L得分登上微軟的MS MARCO(Microsoft MAchine Reading COmprehension)機器閱讀理解測試排行榜首。機器閱讀理解可以讓機器更好地理解一段文字。比如百度可以通過這個技術來理解用戶的搜索內容或者問題,從一個頁面定位答案并經過總結、提煉、歸納后進行展示。這個賽事更大的意義在于,其運用的訓練數據是微軟在產品實踐中收集來的問題和答案,直接從互聯網文本與產品實踐問題中訓練出的模型,應用價值更強。
這些成績,都證明了百度AI技術的實力。而所有這些技術都出自于百度AIG。去年3月,百度宣布整合包括NLP、KG、IDL、Speech、Big Data等在內的百度核心技術,組成百度AI技術平臺體系(AIG),任命百度副總裁王海峰為AI技術平臺體系(AIG)總負責人。現在看來,百度整合多個技術到一個體系,的確讓人才的聚集,技術的管理,以及技術的進步更集中。
然而“屠榜”并不是AIG的目的
算法或者技術拿到獎項,打破記錄,或者登陸榜單,是百度大力支持AI技術的結果,也是百度AI技術實力的證明,但它不是百度AIG存在的唯一目的。AIG不是一個只會研發底層技術來拿獎的實驗室,而是支撐百度業務,特別是AI相關業務的技術平臺。
王海峰曾闡述過他對技術的理解:
“AI的發展最終還是要回到‘服務用戶需求’的本質,這是我們每一位人工智能的從業者都需要銘記在心的。利用好人工智能來服務好我們的用戶和客戶,以及更好地打磨AI能力來推動各行各業的效率提升,是每一位人工智能領域從業者的期望。”
具體來說,百度AIG在大力研發基礎AI技術的同時,還強調AI技術的應用和開放。
首先,在應用層面重視技術的實用性。比如百度人臉技術,就被百度金融應用到與泰康保險、中國農業銀行的合作項目用于人臉核身;烏鎮、武夷山等旅游景區、北京首都機場、南方航空在廣州白云機場的貴賓休息室,應用人臉識別來提升旅客游客的體驗。自然語言處理技術的應用廣泛性無需贅言,語音已是DuerOS的基礎,百度已經與TCL、創維、海爾、海信等諸多家電巨頭,以及華為、小米等手機巨頭戰略合作,知識圖譜也成為百度搜索結果中的重要內容。
抓基礎技術的同時,也在強化對應用技術的投入。今年1月,百度研究院在硅谷成立了兩個新實驗室,一個是商業智能,另一個是機器人與自動駕駛,不再是此前IDL這樣的純技術實驗室,不再只做深度學習、大數據這樣的底層技術研發。從名字就可以看出,百度AIG對應用技術的重視。
百度去年在AI開發者大會上就已經提出要Bring AI to Life,讓AI落地到生活場景中的口號,將AI技術落地到實際業務成為未來的大方向,也與AIG重視“技術驅動產品,產品牽引技術”的策略符合。
其次,在開放層面重視前沿技術的共享。百度AI技術很強大,但不獨享,而是開放給行業。百度目前已經開放了包括語音、圖像、自然語言處理、視頻、增強現實、知識圖譜、智能數據七個方向,共計90余項AI技術能力,成為國內最大的AI開放平臺。百度還將其深度學習框架PaddlePaddle全面開源,讓開發者可以擁抱AI。3月23日,百度在北京舉辦了第一期AI加速器DEMO DAY,百度AI加速器旨在幫助創業者擁抱AI,是百度AI開放的一個舉措。
可以看出,百度AIG的技術路線圖是很清晰,也是很有前瞻性的。一方面,作為百度的基礎技術,AI底層技術不能依賴任何第三方,要自力更生,因此百度AIG在基礎技術上大力投入,不斷在技術上突破、獲獎也證明了這一策略的效果。另一方面,AIG將技術落地到業務中,讓業務牽引技術發展,開放的核心目的也會要促進AI技術在各行各業的落地。當然,反過來,應用和開放也可以鞏固百度AI技術的領先地位。
AIG如何一年內成為百度基座?
百度的基石是什么?相信很多人的答案都是:技術。而技術是由什么構成的?一行行抽象的代碼后面是工程師等技術人的投入,正是因為此,負責百度核心技術的AIG可以說是百度的基座。當百度將多個分散在各個部門的技術部門,以及百度研究院整合到一起時,許多人都看不清百度為什么要這樣做,現在看來好處已經很明顯,讓百度的AI技術沿著更實用的方向研發,加速AI技術落地。AIG在短時間內穩步成長,原因是多方面的。
綜合各種信息來看,目前百度AIG的技術研究部門大致可以劃分成百度研究院和應用技術部門,其中百度研究院的目標很單一,就是要做AI底層技術的研發——不過與谷歌X實驗室等不同的是,它的探索性更低,實用性更高。應用技術部門,則負責技術的應用與落地。今年百度研究院又增加了兩大實驗室,目前已有五大實驗室,實現了對AI基礎和主要應用技術的全覆蓋。
AIG不斷龐大的背后是百度在研發上的堅決投入,李彥宏去年曾表示,百度每年在研發上投入上百億 ,占總收入15%,這個占比位列行業第一。
在人才引進層面,李彥宏對于技術人才一直有“周公吐哺天下歸心”的廣納良才的策略,除了給很好的待遇外,更重要的是很有吸引力的研發環境。百度AIG也在不斷吸納世界頂尖人才,比如百度研究院目前擁有六位世界級科學家。同時百度擁有廣泛的AI應用場景,比如搜索、信息流、DuerOS、無人車,都是AI強相關業務。頂尖的技術團隊和作為技術落地沃土的產品和業務,相互作用下形成了一個良性的的正向循環鏈條,讓百度AI能夠持續“進化”。
在產業環境層面,AI爆發已是不爭事實,2018年AI正在落地到各行各業,但AI技術研發卻需要持續進行,機器在大多數時候還是不如人類,技術進步空間很大。不過,在AI產業爆發后,行業對AI人才的急缺已經讓更多技術人才開始重視學習AI,前不久南京大學甚至成立了AI學院,培養AI專業人才。在這樣的環境下, 百度AIG基于本身的吸引力,要獲取優秀人才會越來越容易。而此前百度在AI技術上多年已久的布局,也讓它有了厚積薄發的能力。
不難看出,百度“先技術后場景”的思路正在改變,逐漸成為技術研發與場景應用雙管齊下,保持技術優勢的同時,推動AI技術商業化。而高速運轉狀態的AIG,正在給百度源源不斷地提供前沿、實用和有競爭力的技術,同時幫助百度AI技術落地和開放