谷歌日前宣布將在旗下郵箱應用Inbox里推出智能自動回復功能:Smart Reply,它能為你篩選適合當下語境的回復短句。那么這背后的技術原理又是什么呢?谷歌的官方博客做了說明。
首先,Smart Reply的模型絕不是幾個工程師自己想出來的,而是基于強大的機器學習系統,對海量郵件里的場景、郵件寫作風格和寫作語氣進行分析,從而生成一些場景化極強的回復內容。
其次,和其他順序類的模型一樣,Smart Reply基于遞歸神經網絡打造。遞歸神經網絡能夠快速掃描收到的郵件內容,轉化機器可以理解的語言,并形成一個矢量(一連串數字)。這個曾被Geoff Hinton 稱之為「具備思考能力的矢量」可以剝開一些修辭直接理解原文意思,比如「你明天有空嗎」的矢量與「你明天工作嗎?」就很類似。接下來,第二層神經網絡就從這個矢量開始,并綜合語法方面的規則作出回復。
這其中的一個挑戰收到的郵件和回復文字很長,谷歌使用一個「long short-term-memory」(LSTM )網絡中的變量,這個變量能夠較好地應對長句,并快速定位到郵件內容的核心部分,從而讓Smart Reply做出回復。據谷歌介紹,引入該變量后,可以有效減少無用句子對系統的干擾。
而至于隱私方面,谷歌則表示,Smart Reply嚴格遵守谷歌對于隱私的規定,也就是說,沒有人類可以閱讀你的郵件,研究人員所看到的只是機器學習得到的數字組合而已。