北京時(shí)間9月1日上午消息,機(jī)器學(xué)習(xí)已經(jīng)成為一種非常有用的翻譯工具,但它還存在一些弱點(diǎn),翻譯模式傾向于逐詞翻譯是其中之一,可導(dǎo)致嚴(yán)重錯(cuò)誤。谷歌在iResearch博客上發(fā)表了一篇有趣的帖子,詳細(xì)說(shuō)明了這個(gè)問(wèn)題的性質(zhì)以及解決方案。
該公司自然語(yǔ)言處理部門(mén)雅克布·烏茲考瑞特(Jakob Uszkoreit)給出了很好的解釋。請(qǐng)思考以下兩個(gè)句子:
我過(guò)了馬路就到了銀行(bank)。
我過(guò)了河就到了岸邊(bank)。
顯然,每句話(huà)中的“bank”指代不同的東西,但是,逐字翻譯的算法可能很可能挑選錯(cuò)誤的含義——因?yàn)樗恢滥囊粋€(gè)“bank”是正確的,除非它能看到句子結(jié)尾。你稍加留意就能發(fā)現(xiàn),這種歧義隨處可見(jiàn)。
我會(huì)改寫(xiě)句子,當(dāng)然,翻譯系統(tǒng)不會(huì)選擇這樣走。如果為了這種簡(jiǎn)單的句子而修改神經(jīng)網(wǎng)絡(luò),那將是非常低效的。
谷歌的解決方案是所謂的關(guān)注機(jī)制(attention mechanism),也就是說(shuō)在翻譯軟件中內(nèi)置一個(gè)名為“變壓器”(Transformaer)的系統(tǒng)。它將句子中的單詞逐一進(jìn)行比較,以確定它們之間是否以某種關(guān)鍵方式相互影響——例如,看“他”或“她”是否在說(shuō)話(huà),或者像“銀行”這樣的詞是否以特定的方式表示。
當(dāng)翻譯句子被構(gòu)建時(shí),關(guān)注機(jī)制將每個(gè)詞與其他詞進(jìn)行比較,就像下面GIF所演示的那樣。
如果這一切聽(tīng)起來(lái)很熟悉,那可能是因?yàn)楸局茉缧r(shí)候你讀過(guò)一篇報(bào)道:谷歌翻譯的競(jìng)爭(zhēng)對(duì)手DeepL也在使用一種關(guān)注機(jī)制。該公司的聯(lián)合創(chuàng)始人提到了這個(gè)問(wèn)題,他們正在為此而努力工作,他甚至提到那篇報(bào)道谷歌的文章,但顯而易見(jiàn),他們的產(chǎn)品與谷歌有所區(qū)別,非常有效,甚至好于后者的版本。
有趣的是,谷歌的方法讓人們有機(jī)會(huì)看到系統(tǒng)的運(yùn)作原理,因?yàn)門(mén)ransformer給每個(gè)詞提供一個(gè)與其他單詞相關(guān)程度的得分,你可以看到它認(rèn)為是相關(guān)的詞,或者潛在的相關(guān)詞:
很酷,對(duì)吧?嗯,我想是的。但也存在另一種類(lèi)型的歧義,因?yàn)樵谟⑽睦铮?ldquo;它”可以指代街道或動(dòng)物,必須看到最后一個(gè)字才能確定bank的含義。人腦可以自動(dòng)計(jì)算和分辨,但機(jī)器仍然必須有人教