今年大會的主題聚焦“新一代人工智能與知識服務”。百度是國內最早全面布局人工智能的企業,王海峰則是百度人工智能的奠基人和領導者。他認為,“匯聚知識的人工智能可以變得更強大,實現對客觀世界的更深層認知,同時人工智能會把知識進行總結、凝練、擴展、傳承,兩者形成正循環,促進人工智能的發展。”
百度大腦于2016年正式發布,如今發展至“多模態深度語義理解”的新階段。會上,王海峰從知識、視覺、聽覺、語言等幾個方面解讀了百度大腦的最新進展,以及百度大腦全面開放這些能力,從深度學習框架、場景化AI能力、定制化訓練平臺、到軟硬一體模組和解決方案等,助力各行各業應用人工智能。
百度大腦構建了完整的人工智能技術布局,包括語音、視覺等感知技術和知識圖譜、自然語言處理等認知技術。隨著人工智能技術的發展,知識成為其進一步突破的重要基礎。王海峰表示,在多元語義知識方面,百度已經構建了包含數億實體、數千億級事實的龐大知識圖譜。除了由實體、屬性、關系構成的實體圖譜,百度還針對不同的應用場景和知識形態,構建了關注點圖譜、事件圖譜、多媒體圖譜、行業知識圖譜等。現場,王海峰播放了一段智能客服為用戶服務的音頻,機器在與用戶的對話中,如人工客服一樣,聽清用戶的話、理解用戶的需求并推薦合理的服務,這背后是百度領先的語音、自然語言理解技術,以及基于業務邏輯和行業知識構建的行業知識圖譜。
讓機器像人一樣聽清并說話,從而實現自然的人機交互,首先要依賴于語音技術。王海峰提到,百度領先的語音技術包括融合聲學模型和語義理解等實現語音語義一體化識別,構建基于深度學習的語音合成系統,以及軟硬一體遠場語音交互技術等。在用戶與“小度”的對話中,機器的聲音不僅清楚流暢,還富有情感,和真人非常接近。
視覺技術讓機器像人一樣觀察世界。王海峰介紹,百度大腦具備豐富的圖像識別體系,基于知識的視頻語義理解,以及由此實現的基于場景的視覺語義化技術。圖像識別是視覺技術的基礎,它讓機器能夠“看見”,視覺語義化技術則讓機器能“看懂”,并提煉出結構化語義知識。比如在零售場景中,視覺語義化技術通過識別人物、動作、物品并關聯時間,將數字化的視頻轉化為結構化的語義知識,既能實現顧客在無人超市購物的完整體驗,還可以幫助管理者分析和優化超市的運營。
自然語言理解技術致力于讓機器更好地理解世界。王海峰以閱讀理解和對話理解為例,介紹了百度自然語言理解技術的新進展。一方面,百度大腦基于閱讀理解能力,自動獲取并學習互聯網中的萬億網頁內容,汲取知識并凝練成知識圖譜,進而支持問答、推薦等應用,并在應用中積累和更新知識,進一步提升機器閱讀理解能力;另一方面,百度大腦在與用戶對話交流的過程中沉淀和豐富知識,持續提升對話理解能力,實現與用戶之間自然流暢的交互。
“百度大腦的各種能力,是由深度學習作為基礎支撐的,”王海峰介紹,百度自主研發的深度學習框架PaddlePaddle,是國內唯一一個開源開放的深度學習框架。今年發布的PaddlePaddle3.0,除了核心框架,百度還開放AI Studio、EasyDL等平臺,滿足更靈活、更廣泛的應用需求,讓開發者可以更平等便捷地獲取AI能力。
百度大腦的技術能力在持續提升,同時面向合作伙伴和開發者的開放也越來越全面和深入,讓越來越多的行業和企業能夠低門檻地獲取AI能力,帶動各行各業的變革與創新。比如醫療行業,百度大腦可以輔助醫生更高效、便捷地篩查眼底、腫瘤等疾病;比如制造業,百度大腦幫助自動識別地板瑕疵,提升質量檢測效果和效率,將工人從重復單一的工作中解脫出來;語音和自然語言處理等技術讓人們“動動嘴”就能控制音箱、電視等,豐富人們的家庭娛樂……借助AI的能力,各行各業在不斷提升效率,創造新的價值。百度大腦也在改變普通大眾的生活,人們動動嘴、拍張照片就能搜索到想要的信息;百度地圖幫助用戶預測路況、規劃路線、躲避擁堵等,為人們提供更加便捷、高效的出行服務。
我們正在越來越清晰地感受到AI帶來的變化,擁抱AI是大勢所趨。王海峰表示,“百度大腦將持續發展人工智能技術,推動知識的融合及應用,同時全方位開放,與行業深度結合,助力行業變革和社會經濟發展。”