精品国产一级在线观看,国产成人综合久久精品亚洲,免费一级欧美大片在线观看

當前位置:統一通信/協作企業動態 → 正文

快9倍!Facebook開源機器學習翻譯項目fairseq

責任編輯:editor007 作者:彭鵬 |來源:企業網D1Net  2017-05-10 21:14:58 本文摘自:雷鋒網

Facebook的使命是讓世界變得更加開放,讓每個人都能以最高的準確性和最快的速度使用自己喜歡的語言來發帖子和視頻進行互動,語言翻譯對此十分重要。

雷鋒網了解到,今天,Facebook的人工智能研究團隊發表了他們的研究成果Fairseq,他們使用了一種新型的卷積神經網絡來做語言翻譯,比循環神經網絡的速度快了9倍,而且準確性也是現有模型中最高的。此外,FAIR序列建模工具包的源代碼和訓練好的系統都已經在開源平臺GitHub上公布,其他的研究者可以在此基礎上建立自己的關于翻譯、文本總結和其他任務的模型。

為什么選擇卷積神經網絡?

卷積神經網絡在數十年前由Yann Lecun 提出,已經在諸如圖像處理之類的領域取得了成功。 循環神經網絡卻是文本領域的現有技術,并且由于其極高的效率而成為語言翻譯的首選。

盡管循環神經網絡以前在語言翻譯上比卷積神經網絡表現的更好。但是其設計具有固有的局限性,這可以通過它們怎么處理信息來理解。計算機一句一句地來翻譯一個文本然后去預測另外一種語言具有相同意思的單詞序列。循環神經網絡以嚴格的從左到右或者從右到左的來進行運算,一次處理一個單詞。這和現在高度并行的GPU硬件有點不符合。由于單詞只能一個接著一個進行處理,計算不能完全并行。而卷積神經網絡可以同時計算所有的元素,充分利用了GPU的并行性。CNN的另一個優點是它對信息進行分層處理,這讓它可以更容易獲得數據之間的復雜關系。

雷鋒網獲悉,在先前的研究中,卷積神經網絡在翻譯任務上的表現要差于循環神經網絡。然而,由于卷積神經網絡架構上的潛力,FAIR開始了研究,發現所設計的翻譯模型顯示了CNN在翻譯方面的優異性能。CNN優異的計算性能將有可能會擴展可翻譯的語言,將包括全球的6500種語言。

最快最好的結果

Facebook團隊的結果表明,在廣泛應用的標準測試數據集(WMT會議提供)上,其比RNN表現的更好。尤其是卷積神經網絡比先前在WMT發表的結果都要好。在英語-法語任務上提高了1.5 BLEU,在英語-德語任務上提高了0.5BLEU,在WMT2016的英語-羅馬尼亞語任務上,提高了1.8BLEU。

對神經機器學習實際應用考慮的一個方面在于翻譯一個句子所需要的時間。 FAIR的卷積神經網絡模型計算的相當快速,比循環神經網絡快樂整整9倍。許多研究都通過量化權重或者其他的方法的方法來加速神經網絡,這也同樣可以用于卷積神經網絡。

用多跳注意和門控來獲得更好的翻譯效果

團隊的架構一個重要的部分就是多跳注意。注意力的機制類似于一個人在翻譯句子的時候會把句子分開翻譯,而不是僅僅看一次句子然后就直接寫下完整的翻譯。所設計的網絡會重復地掃描句子來決定它將要翻譯的下一個單詞。多跳注意是這種機制的加強版,它讓網絡更多次地掃描句子來產生更加好的結果。每一次掃描之間都相互影響。舉一個例子,第一次掃描會注意到一個動詞,然后第二次掃描會注意到相關聯的助動詞。

在下面這幅圖中,Facebook團隊展示了一個系統是怎么閱讀一個法語短語然后再翻譯成英語的。首先,用卷積神經網絡來生成每一個法語單詞的對應向量,在此同時進行計算。然后解碼的CNN再生成對應的英語單詞。在每一步,都掃描一下法語單詞來看一下哪些詞語與下一個要翻譯的英文單詞關系最為密切。在解碼器中有兩層,下面的動畫說明了每一層的注意力機制是怎么完成的。綠線的強度表現了網絡對每一個法語單詞的注意力。當網絡訓練好之后,也就可以進行翻譯了,英文單詞的計算也可以同時進行。

 

快9倍!Facebook開源機器學習翻譯項目fairseq

 

系統的另一個方面是門控,其控制神經網絡里面的信息流。在每個神經網絡中,信息都流過所謂的隱藏單元。的門控機制精確的控制了傳向下一個單元的信息,一個好的翻譯才因此產生。例如,當預測下一個單詞的時候,網絡會把它前面的翻譯部分考慮進去。門控允許它在翻譯的一個特定方向進行放大—這一切都取決于網絡認為其在上下文中認為合不合適。

以后的發展

這一種方法是機器翻譯的一種替代框架,也給其它的文本處理任務提供了新的思路。例如,多跳機制在對話系統中允許網絡注意對話的不同部分。例如對兩個沒有聯系的事實,可以把它們聯系在一起來更好地回答復雜的問題。

via code.facebook,雷鋒網(公眾號:雷鋒網)編譯

AI科技評論招聘季全新啟動!

很多讀者在思考,“我和AI科技評論的距離在哪里?”答案就是:一封求職信。

AI科技評論自創立以來,圍繞學界和業界鰲頭,一直為讀者提供專業的AI學界、業界、開發者內容報道。我們與學術界一流專家保持密切聯系,獲得第一手學術進展;我們深入巨頭公司AI實驗室,洞悉最新產業變化;我們覆蓋A類國際學術會議,發現和推動學術界和產業界的不斷融合。

而你只要加入我們,就可以一起來記錄這個風起云涌的人工智能時代!

關鍵字:機器開源Facebook

本文摘自:雷鋒網

x 快9倍!Facebook開源機器學習翻譯項目fairseq 掃一掃
分享本文到朋友圈
當前位置:統一通信/協作企業動態 → 正文

快9倍!Facebook開源機器學習翻譯項目fairseq

責任編輯:editor007 作者:彭鵬 |來源:企業網D1Net  2017-05-10 21:14:58 本文摘自:雷鋒網

Facebook的使命是讓世界變得更加開放,讓每個人都能以最高的準確性和最快的速度使用自己喜歡的語言來發帖子和視頻進行互動,語言翻譯對此十分重要。

雷鋒網了解到,今天,Facebook的人工智能研究團隊發表了他們的研究成果Fairseq,他們使用了一種新型的卷積神經網絡來做語言翻譯,比循環神經網絡的速度快了9倍,而且準確性也是現有模型中最高的。此外,FAIR序列建模工具包的源代碼和訓練好的系統都已經在開源平臺GitHub上公布,其他的研究者可以在此基礎上建立自己的關于翻譯、文本總結和其他任務的模型。

為什么選擇卷積神經網絡?

卷積神經網絡在數十年前由Yann Lecun 提出,已經在諸如圖像處理之類的領域取得了成功。 循環神經網絡卻是文本領域的現有技術,并且由于其極高的效率而成為語言翻譯的首選。

盡管循環神經網絡以前在語言翻譯上比卷積神經網絡表現的更好。但是其設計具有固有的局限性,這可以通過它們怎么處理信息來理解。計算機一句一句地來翻譯一個文本然后去預測另外一種語言具有相同意思的單詞序列。循環神經網絡以嚴格的從左到右或者從右到左的來進行運算,一次處理一個單詞。這和現在高度并行的GPU硬件有點不符合。由于單詞只能一個接著一個進行處理,計算不能完全并行。而卷積神經網絡可以同時計算所有的元素,充分利用了GPU的并行性。CNN的另一個優點是它對信息進行分層處理,這讓它可以更容易獲得數據之間的復雜關系。

雷鋒網獲悉,在先前的研究中,卷積神經網絡在翻譯任務上的表現要差于循環神經網絡。然而,由于卷積神經網絡架構上的潛力,FAIR開始了研究,發現所設計的翻譯模型顯示了CNN在翻譯方面的優異性能。CNN優異的計算性能將有可能會擴展可翻譯的語言,將包括全球的6500種語言。

最快最好的結果

Facebook團隊的結果表明,在廣泛應用的標準測試數據集(WMT會議提供)上,其比RNN表現的更好。尤其是卷積神經網絡比先前在WMT發表的結果都要好。在英語-法語任務上提高了1.5 BLEU,在英語-德語任務上提高了0.5BLEU,在WMT2016的英語-羅馬尼亞語任務上,提高了1.8BLEU。

對神經機器學習實際應用考慮的一個方面在于翻譯一個句子所需要的時間。 FAIR的卷積神經網絡模型計算的相當快速,比循環神經網絡快樂整整9倍。許多研究都通過量化權重或者其他的方法的方法來加速神經網絡,這也同樣可以用于卷積神經網絡。

用多跳注意和門控來獲得更好的翻譯效果

團隊的架構一個重要的部分就是多跳注意。注意力的機制類似于一個人在翻譯句子的時候會把句子分開翻譯,而不是僅僅看一次句子然后就直接寫下完整的翻譯。所設計的網絡會重復地掃描句子來決定它將要翻譯的下一個單詞。多跳注意是這種機制的加強版,它讓網絡更多次地掃描句子來產生更加好的結果。每一次掃描之間都相互影響。舉一個例子,第一次掃描會注意到一個動詞,然后第二次掃描會注意到相關聯的助動詞。

在下面這幅圖中,Facebook團隊展示了一個系統是怎么閱讀一個法語短語然后再翻譯成英語的。首先,用卷積神經網絡來生成每一個法語單詞的對應向量,在此同時進行計算。然后解碼的CNN再生成對應的英語單詞。在每一步,都掃描一下法語單詞來看一下哪些詞語與下一個要翻譯的英文單詞關系最為密切。在解碼器中有兩層,下面的動畫說明了每一層的注意力機制是怎么完成的。綠線的強度表現了網絡對每一個法語單詞的注意力。當網絡訓練好之后,也就可以進行翻譯了,英文單詞的計算也可以同時進行。

 

快9倍!Facebook開源機器學習翻譯項目fairseq

 

系統的另一個方面是門控,其控制神經網絡里面的信息流。在每個神經網絡中,信息都流過所謂的隱藏單元。的門控機制精確的控制了傳向下一個單元的信息,一個好的翻譯才因此產生。例如,當預測下一個單詞的時候,網絡會把它前面的翻譯部分考慮進去。門控允許它在翻譯的一個特定方向進行放大—這一切都取決于網絡認為其在上下文中認為合不合適。

以后的發展

這一種方法是機器翻譯的一種替代框架,也給其它的文本處理任務提供了新的思路。例如,多跳機制在對話系統中允許網絡注意對話的不同部分。例如對兩個沒有聯系的事實,可以把它們聯系在一起來更好地回答復雜的問題。

via code.facebook,雷鋒網(公眾號:雷鋒網)編譯

AI科技評論招聘季全新啟動!

很多讀者在思考,“我和AI科技評論的距離在哪里?”答案就是:一封求職信。

AI科技評論自創立以來,圍繞學界和業界鰲頭,一直為讀者提供專業的AI學界、業界、開發者內容報道。我們與學術界一流專家保持密切聯系,獲得第一手學術進展;我們深入巨頭公司AI實驗室,洞悉最新產業變化;我們覆蓋A類國際學術會議,發現和推動學術界和產業界的不斷融合。

而你只要加入我們,就可以一起來記錄這個風起云涌的人工智能時代!

關鍵字:機器開源Facebook

本文摘自:雷鋒網

電子周刊
回到頂部

關于我們聯系我們版權聲明隱私條款廣告服務友情鏈接投稿中心招賢納士

企業網版權所有 ©2010-2024 京ICP備09108050號-6 京公網安備 11010502049343號

^
  • <menuitem id="jw4sk"></menuitem>

    1. <form id="jw4sk"><tbody id="jw4sk"><dfn id="jw4sk"></dfn></tbody></form>
      主站蜘蛛池模板: 威信县| 铅山县| 金塔县| 马龙县| 大姚县| 巴南区| 桐乡市| 剑河县| 神木县| 榆社县| 永济市| 平陆县| 宁河县| 平罗县| 墨竹工卡县| 河南省| 珲春市| 陈巴尔虎旗| 阳曲县| 灵川县| 闽清县| 哈巴河县| 天水市| 日照市| 遵化市| 绵竹市| 河东区| 安义县| 名山县| 邮箱| 宝山区| 大余县| 远安县| 扶沟县| 郯城县| 汝南县| 宣武区| 鹤山市| 陈巴尔虎旗| 阿荣旗| 灵山县|