美國時間5月9日,Facebook 的人工智能(AI)研究團隊宣布,已經開發出一項新的語言翻譯技術,翻譯速度及準確度均超越谷歌翻譯。這項技術再次印證了社交媒體的使命:讓世界更開放、更緊密。
語言成為了不同母語的人群間相互交流的障礙,所以突破這層阻攔是社交平臺完成使命的必經之路。此前,Facebook可以自動翻譯超過45國語言的狀態內容,但是Facebook的CEO扎克伯格稱“仍有進步空間”。
谷歌機器翻譯系統基于循環神經網絡(RNN),是老牌翻譯系統,已經處于領先地位。但是,微軟于2016年12月推出了最新技術,在翻譯復雜句型時可以較靈活調整語序,準確度較高。
Facebook的人工智能程師Michael Auli和David Grangier介紹,他們的翻譯技術突破在于發揮卷積神經網絡(CNN)獨特優勢,使其性能超越基于RNN的翻譯技術。谷歌機器翻譯系統是基于RNN,這意味著Facebook翻譯速度將是谷歌的9倍。
CNN和RNN是兩種神經網絡,被用以處理數據序列。RNN是循環分析數據,嚴格按照句子從左到右的順序一個字一個字進行翻譯。而CNN可以同時從不同角度捕捉數據,更好地契合機器圖形處理器(GPU)硬件系統,CNN的特性和GPU的并行計算功能相輔相成。
GPU是為處理視頻游戲中的圖像而設計的。據彭博社報道,CNN與其的結合意味著用戶將有機會在Facebook查閱的每一項內容,都以用戶的習慣語言表述,不僅是狀態文字,還有視頻。
在翻譯技術突破方面,另一項杰出表現是使用多跳注意力(multi-hop attention)和門控(gating)來改善翻譯效果。注意力機制類似于人在翻譯時的斷句,系統在翻譯時會回看和多次看整個句子來選擇下一個翻譯的詞語,這樣更接近人類翻譯時的順序。而多跳注意力是其升華版,利用網絡反復回看,做出最符合的翻譯。
門控是用來控制神經網絡內的信息流動,決定某一特定信息是否可以通過并傳輸到下一個神經元。在選擇下一個翻譯的單詞時,神經網絡會考慮到目前為止所做的翻譯。門可以任意放大某一部分的翻譯或者整體的大意,以確保接下來選擇符合的語境。
目前這項技術還停留在研究階段,沒有完全開發并在Facebook產品上發布。但是,該技術已經應用在翻譯狀態更新上。
Facebook稱已經公開這項翻譯資源的源代碼,大家可以利用該資源來滿足個人翻譯需求。除了翻譯,這項技術還可以被廣泛應用到其他語言類項目。