據悉,這是博鰲論壇創辦17年來,首次嘗試現場用機器同傳。區別于以往的單主講人會議,此次也是AI同傳類產品首次公開支持討論型會議。
現場,AI同傳服務會覆蓋到會議現場投屏、小程序查看、語音收聽、會議紀要回放等多個渠道。
騰訊方面稱,騰訊翻譯君目前可以支持15個語種,83種語言對的翻譯能力,其中中英互譯引擎已經在新聞、學習和部分科技領域達到業界領先水平。根據以往數據,騰訊同傳服務在會議現場的平均語音識別準確率可達97%,翻譯可接受度超過93%。
這也是神經網絡翻譯2年時間帶來的結果。
在2016年Google基于神經網絡翻譯引擎的論文發表后,一石激起千層浪,瞬間點燃了機器翻譯領域的新烽火,騰訊翻譯君便是其中一家。其后,騰訊也基于自研的神經網絡翻譯引擎,打造了騰訊AI翻譯產品翻譯君。
不同的是,由于騰訊眾多消費級產品和語料資料,翻譯君可以從海量語料庫中自主學習,在翻譯全過程中整體建模,從而提升翻譯結果的準確率與流暢度。
此次作為騰訊同傳組團亮相的,還有微信智聆。目前,其最常見的應用場景是微信中的語音轉文字。
公開資料顯示,該團隊成立于2011年,是微信事業部內致力于開發語音人工智能技術的團隊,包括語音識別,語音合成,聲紋認證,語音喚醒,遠場陣列拾音等領域。
微信智聆方面稱,經過團隊6年打磨,語音識別正確率可達到97%。目前主要在三大體系中應用:
1)面向智能手機:微信語音輸入,微信語音轉文字,QQ音樂搜索,王者榮耀等;
2)面向行業級:電話語音識別,公檢法語音筆錄轉寫,復雜音頻音頻監控,英語口語發音評估等;
3)面向智能硬件:智能音箱,車載車機,智能電視等,為個人和企業用戶提供可靠實用的語音技術。
據量子位報道,此次博鰲論壇上的AI同傳,依舊存在諸多挑戰。
首先,區別于單主講人會議,博鰲論壇上有不少討論型會議,對于AI來講并不簡單。
其次,博鰲亞洲論壇具有語種變化多(中英文隨機發言)、專業領域多(涵蓋政治、經濟、科技)、人數多(發言數百人)等特征,這些也都會加劇AI同傳的難度。
最后,如何在專業度高、覆蓋領域廣的特殊場景下實現高質量翻譯和同傳,也是難點之一。
如此看來,人類同傳的機敏反應速度、交叉學科知識積累,在現階段與AI同傳的博弈中,依舊有著重要的領先意義。而未來,隨著AI同傳自身深度學習的能力不斷提升,水平的增長也是指日可待。
至于“取代人類”之說,尚且言之過早。姚勁波曾在品途商業評論(ID:pintu360)的采訪中指出,AI會為人類省去大量繁雜的工作。此外,其獨有的大數據分析能力也可以讓專業人才各司其職。