我們認為目前人工智能領域的競爭焦點,已經部分從技術、資本向商業應用轉移,有價值應用場景的挖掘和技術的應用落地成為影響AI廠商接下來競爭成敗的關鍵。另一方面,將自身AI技術開放出來,構建賦能平臺成為部分AI廠商的選擇。在這樣一個市場交替之際,中國軟件網策劃了“2018中國AI應用、平臺與生態”系列專訪,傾聽來自一線的聲音,從實踐中分析AI應用的那些痛點和經驗。
作為本次系列專題的第一期,我們采訪了三角獸的CTO亓超,跟他一起聊一聊語義理解的具體應用,以及三角獸科技在這方面的實踐探索。
語義理解與語音識別的不同
亓超談到,在大眾的認知中,語音識別和語義理解仿佛是密不可分的,我們更多的關注到了這兩者的結合,而對他們的區別了解較少。亓超指出,語義理解與語音識別是有一定獨立性的,他們可以一起合作發揮作用,也可以各自獨立發揮作用。以語義理解為例,既可以作為語音識別的后續動作,對識別出的語言進行分析;也可以直接對提供的文本信息進行分析,而不僅僅是分析語音轉換來的文本信息。
自然語言處理技術早已廣泛應用于各種場景,例如搜索引擎、推薦系統等。當然語義理解和語音識別也是相互融合的,才能產出好的語音交互產品,這也是顯示技術功力的重要方面。系統聽到的某段語音,因為對其含義的不同理解,會給出差別較大的結果。在專訪中,亓超現場向我展示了三角獸為小米電視提供的語音交互方案,并用語音來點播電影。有趣的是,系統能自動修正一些不規范發音,給出盡可能正確的結果。在亓超現場展示中,對系統說出“路遙知馬力“ ,而結果卻是”陸垚知馬俐“這部電影,其實沒有所謂的“路遙知馬力“這部電影,系統自動給出了最接近的結果。這用到了三角獸提供的模糊語義識別技術,可以根據用戶不清晰或者不準確的表達,反饋盡可能準確的結果。
人機對話的四種類型及其區別
亓超提到,人機對話是一個比較綜合的領域,還可以細分為幾個不同的種類,包括開放域聊天、問答、推薦及任務驅動的多輪對話。上面從幾個特定場景出發,分析了人機對話的應用價值,下面我們系統介紹下人機對話的幾種類型及其價值。
開放域聊天,是指不局限話題的聊天,即在用戶沒用明確的信息或服務獲取需求情況下人機之間的交互過程。人們所說的調戲Siri或者某個具有對話功能的機器人,就屬于開放域聊天。三角獸的核心團隊在這方面技術積累深厚,在創建三角獸之前就先后打造微軟小冰和百度度秘兩款明星產品,這次三角獸更是推出性格可定制的聊天機器人,將開放域聊天又向前推進了一步。
問答系統,直接根據用戶的問題給出精準的答案,這更接近一個信息檢索的過程。雖然也可能涉及簡單的上下文處理,但通常是通過指代消解和詢問補全來完成。問答系統在智能客服領域應用比較普遍,系統根據用戶提出的問題來進行回答。
人之間的交互大多不是一次完成的,而是要進行多次交互,這就要用到任務驅動的多輪對話系統。在很多場景中,用戶往往帶著明確的目的而來,并希望得到滿足特定限制條件的信息或服務,例如:訂餐,訂票,尋找音樂、電影或某種商品等。任務驅動的多輪對話不是一個簡單的自然語言理解加信息檢索的過程,而是一個決策過程,需要機器在對話過程中不斷根據當前的狀態決策下一步應該采取的最優動作,從而最有效的輔助用戶完成信息、服務獲取的任務,這也是任務驅動的多輪對話與問答系統的重要區別。亓超談到,三角獸在任務驅動的多輪對話系統方面有深厚的技術積淀,并將這一能力廣泛應用于智能家居、智能車載、智能機器人、智能手機等領域中。
與上面談到的開放域聊天、問答系統和任務驅動的多輪對話本質上是被動響應用戶詢問不同,推薦系統是主動推薦用戶可能感興趣的信息或者服務,推薦的基礎則是當前的用戶詢問和該用戶詢問歷史所構建的用戶畫像。亓超提到,三角獸基于挖掘和推薦技術,以人機對話為依托建立深度用戶畫像,讓人機交互從被動響應到主動推薦,給用戶和企業創造更多商業價值。
亓超認為,由于上述幾種人機對話類型較大的技術差異,用一套系統實現所有功能是不現實的。如果要將上述功能整合在一個應用中,需要一個中控決策模塊,這個模塊不僅負責需求和問題的分類,還包括任務之間的澄清、確認和跨領域的引導,進而通過一個決策過程來完成不同類型對話的應用整合。在真實的商業應用中,既有解決某類問題的系統,也有綜合多種類型的系統,他們根據不同的商業訴求發揮各自作用,共同推動智能人機交互產業的發展。
人機交互的商業應用場景和價值
三角獸是人工智能語義公司,基于大數據和深度學習算法,提供對話式交互解決方案和端對端交互系統。那么人機對話系統可以用到哪些地方,怎么用,又能產生哪些價值?
三角獸想要通過人工知智能的應用達成什么樣的目的呢,用他們的話說就是“大幅提升效率,降低成本“。如何來實現,我們以比較典型的智能客服為例來進行說明。三角獸推出了針對企業的智能交互系統,可以讓企業微信、微博、App、官網等具備對話能力,提升粉絲粘性,提升品牌和市場運營效率。以新世界集團K11官方微信應用為例,通過智能對話系統,可以讓其官方微信可以及時的與客戶進行互動,解決客戶提出的問題。作為對人工客服的替代,智能客服系統大大降低了人力成本。更進一步的,智能客服能避免了人工客服的一些天然限制:人工客服有時間限制,晚上和節假日都工作未免有點“不人道”,智能客服則能提供24小時全年無休的服務;人的知識有局限,單個客服很難對公司的所有業務都熟悉,很難通過單個客服就能解決用戶的所有問題,更不能解決所有用戶的問題。我們在接通人工客服后,一般都要根據具體的問題來進行轉接,這就帶來較多的麻煩。智能系統可以對公司信息進行全面細致的掌握,較好的應對不同用戶提出的問題。
當然,除了嚴肅的問題解決式對話,智能客服也會是一個很好的娛樂工具。如果某個企業的智能客服足夠“有趣”,給用戶帶來樂趣,對于提升用戶粘性必然大有裨益。事實上,能講段子已經成為智能交互系統的一大賣點了。人們往往是在不斷的笑聲中,慢慢對機器系統產生好感,從而產生購買或者深度使用的意愿。
除了上面提到的智能客服,三角獸拓展了廣泛地智能人機交互應用領域,其中企業服務(商業、媒體、金融、客服等領域)、智能終端(智能家居、智能車載、智能手機、智能機器人和音箱等)和泛娛樂(二次元、游戲、偶像角色等)三個具體的領域是其重要的商業應用方向,并且已經與錘子手機、Rokid機器人、富士康、廣發證券、騰訊 、新世界集團,以及2家智能手機廠商、1家智能家居巨頭等公司達成了合作。正如亓超所言,三角獸廣泛的場景應用和多樣化的產品布局,都離不開一條主線,那就是通過智能人機交互方案來為客戶實現“降本增效”的商業訴求。
附錄 企業介紹
三角獸是人工智能語義公司,致力于深度學習與認知計算,輸出對話式交互解決方案和端對端交互系統,為金融、電信及IoT(包括智能手機、智能電視、智能車載等)等領域企業與政府部門提供解決方案,大幅提升用戶體驗,提升效率,降低成本。 三角獸由來自微軟、百度、阿里、IBM、樂視等企業的資深算法工程師團隊和連續創業經驗豐富的市場運營團隊組成。 目前已經與微軟、百度、中國移動、富士康、新浪、小米、錘子、恒生、Rokid等達成合作,是國內人工智能語義領域發展最快,技術應用落地領域最廣的公司。 2016 年 4 月獲得洪泰基金和天善資本 1000 萬人民幣天使投資,9 月獲得君聯資本和賽富 2000 萬人民幣投資,2017 年 1 月獲得東方網力旗下博雍基金、恒生電子和索道資本 5000 萬人民幣投資。