近日,北京分音塔科技有限公司(以下簡稱“分音塔”)推出的清華準兒第二代WiFi翻譯一體機——包括39個語種51國口音、集成無線上網功能的人工智能口語翻譯一體機,將有望解決出境游客行中語言痛點。
從旅游市場切入
現在,很多公司紛紛試水翻譯機的研發與生產。據不完全統計,僅從2016年上半年到2017年上半年,國內外有多家企業推出了智能翻譯機產品,既有來自澳大利亞、日本、荷蘭的創業企業,也有中國語音科技企業科大訊飛、雙猴科技和分音塔。
據分音塔CEO關磊介紹,分音塔研發的第二代翻譯機,定位出境游市場。第一是因為中國人出境游市場正在快速增長,市場很大;第二是隨著消費升級,出境游開始從大眾化的跟團旅游發展到深度游,“80后”“90后”更愿意自由行,語言溝通不暢成為出境游圖中的一大痛點。
清華準兒翻譯機采用自主研發的清華準兒深度學習算法和神經網絡算法,應用四麥線性差值陣列,越用越智能和精準,還支持多機對話,多人多語種跨地域對話不在話下。7月即將上市的準兒翻譯機是第二代產品,較之去年6月出品的一代產品來說,除了支持多機對話,還新增支持離線翻譯、拍照翻譯、景區導覽等功能,可以說集WiFi、翻譯、景區講解于一體。
在出外旅行過程中,翻譯機一般會應用在機場、酒店、景點、商場和餐廳等場景中。“技術只有解決用戶在實際場景的需求才更有價值。準兒聚焦在出境游應用中,也避免了通用型的翻譯語言在個性化的應用場景中‘失真’,翻譯準確率也會更高。”關磊介紹,根據一代產品使用等數據顯示,準兒翻譯機在旅游行業的復租率達到70%,日調用達100.4次,最高月調用率超過15000次。
跨語言溝通與使用環境有很大的關系。分音塔的準兒翻譯機在旅游和日常交流中,中英口語翻譯準確率達92%,中日翻譯準確率達81%,中韓、中泰的翻譯準確率在70%,在化工和醫療等其他專業化領域翻譯準確率還不是特別高。關磊解釋說:“主要是我們的機器在這種專業化場景中的應用較少,足夠的智能分析數據也是讓準確率提升的重要因素。”
智能翻譯的創新者
關于解決語言溝通問題,很多企業從APP著手,譬如百度、有道等開發了在線翻譯的APP,用到出境旅游的場景中。螞蜂窩旅行翻譯官APP甚至支持多種語言,小語種場景化,手寫輸入翻譯。流行于歐美的Read for Me APP,可拍攝照片,直接翻譯,能識別30種文字,并能翻譯成36種語言,還提供18種語言的發音功能。
依托智能手機的攝像頭和觸屏,翻譯APP可以識別圖片和手寫輸入文字。對比翻譯機而言,關磊表示,翻譯APP產品存在使用低頻和短時單向的問題。
翻譯APP,更像一個電子詞典,輸入才輸出,手機要遞給對方看,即便是有朗讀軟件配合使用,也會出現交流延時,還不能做到即時聽說。如果完全借助APP,與目的地的居民做深入的交流存在困難,因為APP的準確率還不是很高,即時交流還需要翻譯機輔助。
而且分音塔在做準兒翻譯機的時候,遇到的問題復雜得多。比如用戶使用不在中國,使用的場景可能在美國、日本、塞班、馬爾代夫等世界各地,也可能在餐廳、酒店、酒吧、街頭等極其復雜的場景。在特別嘈雜的環境中,差距30厘米的語音識別效率會大幅度下降。“智能手機語音識別的范圍在20厘米左右,超出這個范圍,語音識別度非常低。分音塔團隊研發的準兒降噪技術,已經可以適用于50厘米到150厘米范圍內,識別效果非常好。”關磊說。
與中國東南西北各地的口音差別一樣,外國人也有口音,英語有美式、英式、加拿大、南非等很多口音,美式英語的口音識別很差。分音塔的第一代翻譯機發現了這樣的問題,于是增加了語音的自然語言理解能力,從最早上線支持4種語音,到目前支持39種語言、52種口音,成為支持語言、口音最多的翻譯機。同時,它可以根據LBS(基于位置的服務)場景來實時選擇當地所需要的口音,從而提升語音識別準確率。
智能翻譯機將是新藍海
人和人溝通,7%的信息傳遞是通過語言,38%是通過語調和語速,55%是通過表情和動作。為了增強人機交互,分音塔團隊給準兒增加了一塊屏幕,由此通過視覺來彌補聽覺的不足。
用戶在使用中還會面臨網絡環境的問題,比如中國、韓國、日本的網絡環境比較好,翻譯機在線工作不存在問題,但在加拿大、澳大利亞以及歐洲大部分國家的網絡信號不穩定。這倒逼著分音塔團隊開發出離線語音識別技術。目前,分音塔團隊與清華大學語音和語言技術研究中心聯手攻克了中、日、英三種語言的離線語音識別技術,其中日語離線語音識別技術是國內零突破。
據關磊介紹,第二代準兒翻譯機可以實現離線翻譯。支持WiFi、4G卡、虛擬卡的全球聯網,機器本身可以作為熱點,分享給手機、Pad使用。首創翻譯機AI識物拍照,除了可拍照翻譯菜單、路牌、文字、標識等,也可拍動植物,通過AI識別進行信息的翻譯和詳解。新增全球景區導覽功能,出境游自由行再也不用走馬觀花,而可以輕松運用AI拍照深度了解國外景點。
國內智能翻譯機的技術模型成熟了,智能翻譯機的市場藍海未來發展前景如何?關磊認為,隨著技術的發展和AI技術的成熟,預計明年國內國際會有很多公司去做翻譯機這款產品,包括仿制品都會出來。在關磊看來,未來的翻譯機一定是多種模型,就像人和人的交互一樣,有聲音的傳遞,有語氣語調的傳遞,有肢體語言的傳遞。然而,距離成熟的能達到同聲翻譯功能的機器面世還有很長的道路,智能翻譯機的未來將是一片新藍海。