一年前,微軟宣布,神經網絡正在為Microsoft Translator提供支持,微軟還為開發者提供了支持神經網絡翻譯的Microsoft Translator Text and Speech API。從那時起,微軟開始擴大神經機器翻譯(NMT)的使用范圍,以改善所有Microsoft Translator產品和Microsoft Translator Text and Speech API的翻譯表現。
和傳統的機器翻譯相比,微軟神經網絡翻譯在翻譯質量上的進步十分明顯,今天,微軟宣布升級其神經網絡,為其再添加10種語言的支持,它們分別是:保加利亞語、捷克語、丹麥語、荷蘭語、印地語、挪威語、葡萄牙語、羅馬尼亞語、瑞典語和土耳其語。
微軟提到,所有簡體中文和印地語與中文的互譯都默認使用神經網絡翻譯系統,微軟還推出了一種名叫“混合型神經網絡翻譯”的東西,即使其中一種翻譯語言不是神經網絡翻譯支持的語言,也可以通過神經網絡翻譯系統改進翻譯質量。
在翻譯的過程中,如果兩種語言之間缺乏可用的訓練數據,那么英語將作為兩種語言的中間語言,比如要將法語翻譯成中文,微軟翻譯不會走法語-中文的路子,而是走法語-英語-中文的路子,即先把法語翻譯成英語,再把英語翻譯成中文。傳統機器翻譯如此,神經網絡翻譯也不例外。
要了解關于微軟神經網絡翻譯的更多信息,請點擊這里。