這個系統(tǒng)可能有一天會用于復(fù)述、團隊論斷、機器翻譯和會話系統(tǒng)。它可以補充微軟研究所11月展示的系統(tǒng),該系統(tǒng)利用復(fù)雜的自然語言處理技術(shù)來推理弱結(jié)構(gòu)文本中的關(guān)系。“在這項工作中,我們解決了修改句子文本屬性的問題。”研究人員寫道。“據(jù)我們所知,我們演示了首個能夠在沒有并行數(shù)據(jù)的情況下,修改給定句子的多個文本屬性的實例。”
該團隊首先解決了情緒控制問題。他們找來了一個餐館評論數(shù)據(jù)集——Yelp評論數(shù)據(jù)集的過濾版本,以及大量的IMDB電影評論,這兩個數(shù)據(jù)集分別有447,000和300,000個句子,他們用來訓(xùn)練系統(tǒng)。
在培訓(xùn)完成之后,研究人員使用包含了128,000條餐廳評價和36,000條電影評論的測試數(shù)據(jù)集,嘗試將原本帶有負面情緒的句子轉(zhuǎn)換成具有正面情緒的文本,而將帶有正面情緒的句子轉(zhuǎn)換成帶有負面情緒的文本。
用“雙語評估替換”(BLEU)進行的評估表明,這個人工智能系統(tǒng)能夠勝過兩種領(lǐng)先的文本生成方法。BLEU是一套評估機器翻譯文本的標準方法。此外,它始終能夠生成與輸入的句子相關(guān)的、語法正確的句子,在某種程度上,亞馬遜的Mechanical Turk研究參與者認為它的輸出比以前的方法更為真實。
這個系統(tǒng)生成的句子的連貫程度令人驚訝。在一個例子中,“柜臺后面的人不友好”變成了“柜臺上的人非常友好并且樂于助人。”在另一個例子中,模型將“這是這部電影另一個有趣的地方”變成了“這部電影的質(zhì)量簡直糟得沒救了”。
更令人印象深刻的是,在另一項測試中的研究人員使用該系統(tǒng)同時控制句子的多種屬性,包括情緒、時態(tài)、態(tài)度和情緒。在用來自Toronto BookCorpus數(shù)據(jù)集的200萬個文本片段進行培訓(xùn)之后,該模型能夠?qū)⑽磥頃r態(tài)中的指示性情緒,“約翰將無法在營地中生存”轉(zhuǎn)換為條件時態(tài)中的虛擬語氣,“約翰不能住在營地”。