精品国产一级在线观看,国产成人综合久久精品亚洲,免费一级欧美大片在线观看

Facebook 推出即時翻譯功能,讓你用44種語言發帖

責任編輯:editor006

作者:機器之心 Synced

2016-07-03 21:06:03

摘自:百度百家

另一方面,如果用戶自己人工翻譯帖子的話,這將會給 Facebook 翻譯系統的機器學習增加大量數據,讓這個翻譯系統更加聰明。

全球有超過 15 億人使用 Facebook,用戶來自不同國家和文化背景,說著數百種語言。這讓很多 Facebook 用戶在交流時顯得頗為困難。于是 Facebook 推出了即時翻譯功能,讓你用44種語言發帖。

全球有超過 15 億人使用 Facebook,但其中只有一半說英語。另外一半使用其他幾百種語言進行交流,這讓很多 Facebook 用戶在交流時顯得頗為困難。

但這種情況正在改變。如果你在刷 Facebook 的時候看到了一條外文帖子,Facebook 就會給你一個提示:你可以即時翻譯這篇帖子。而從今天開始,很多 Facebook 還可以選擇在發帖的時候將自己的帖子翻譯成 44 種其他的語言,這樣你的帖子就能在顯示在其他語言使用者的信息流上時就會以他的語言顯示。這是 Facebook 第一次公開測試其「多語發帖」功能,其目標是讓全球用戶都能更方便地跟朋友交流。「這就是我來到 Facebook 的原因,」主導 Facebook 即時翻譯功能的土耳其人 Necip Fazil Ayan 說。

使用 Facebook 主頁的名人和商業團體也可以使用這個即時翻譯功能。每天,有超過 5000 個商業團體和名人的主頁在 Facebook 上以各種語言發布超過 10000 篇帖子,而這些帖子將會展示在大約 7000 萬用戶的信息流里,其中有三分之一用戶不使用英文。Ayan 關注了巴西球星小羅納爾多的 Facebook 主頁,小羅會在發布帖子時同時使用葡萄牙語、西班牙語和英語?!肝抑荒芸吹接⒄Z,」Ayan 說。

Facebook 一直都在研究其平臺上的即時翻譯功能,因此,Facebook 的系統知道如何將「生快」翻譯成西班牙語的「Feliz cumplea os 」,而谷歌翻譯就無法準確地翻譯出「生快」。今年早些時候,Facebook 的系統知道了一些法語使用者在說英語中的「wow」時,會以法語發音「uau」代替,所以系統在翻譯時就會準確地將「usu」翻譯成「哇哦」。

另一方面,如果用戶自己人工翻譯帖子的話,這將會給 Facebook 翻譯系統的機器學習增加大量數據,讓這個翻譯系統更加聰明。

人們在 Facebook 上交流和分享時會采用很多種不同的語言。全世界有 50% 的人不講英語,而且大多數人只會說一種語言。正因如此,我們一直在思考,有沒有什么辦法可以消除 Facebook 上遇到的語言障礙。

Facebook 上很多主頁都有來自各種文化背景的關注者,他們說著不同的語言,而主頁君經常想要在他們之間分享信息。以前,他們常常會用不同的語言創建多條帖子,然后用 post targeting 為每個帖子選擇特定的受眾。還有的人將用多種語言寫的不同版本的信息串成一篇長帖,但這種方法并不理想,因為人們需要查看一大段長文本才能找到自己理解的部分。而為每種語言的關注者單獨編輯信息的方式 ,則會耗費額外的管理時間和精力。

有了這個多語言編輯器后,主頁君和其他人就能用多種語言編輯帖子,而每個關注者會只看到自己熟悉的語言版本。這樣,各種關注者都能更方便地與他們關注的品牌主頁或個人進行交流。

從今年年初開始,所有主頁都可以使用該編輯器。現在平均每天使用編輯器的主頁大約為 5,000 個 ,編輯帖子次數達到 10,000 次,這些帖子每天的閱讀量共計 7,000 萬次,其中瀏覽由某種第二語言翻譯的帖子數量達到 2,500 萬次。我們非常激動,這個工具正在幫助越來越多的 Facebook 用戶與他們說不同語言的朋友進行聯絡。

編輯器體驗:使用機器翻譯創建多語種帖子

建立編輯器組件的過程相對直接。作者在創建一個新帖子后,可以選擇是否用其他語言編輯該帖。作者可以通過下拉菜單指定他們希望采用的語言。編輯器組件使用 React 提供額外的文本區域,Flux 則用來處理事件,維持狀態,或者相應地升級 UI (用戶界面)。在創建帖子的同時,多語言數據就會傳送到服務器。

我們正在測試一項幫助作者創建多語言帖子的預填寫功能,在該功能下,根據第一語言編輯的信息,使用機器翻譯技術可以預填寫用另一種語言編輯的信息。作者可以在這個翻譯文本的基礎上編寫自己的翻譯內容,也可以使用機器提供的翻譯版本。機器翻譯的這些內容由機器學習模型生成,而機器學習模型已經進行過了幾十萬或上百萬次的各種語言之間的互譯訓練。Facebook 其他地方的翻譯生成功能使用的是同一個系統,比如帖子和評論旁邊出的 「See Translation (見翻譯)」功能等。

儲存多語言帖子:級聯(Concatenation) VS 作者翻譯

構建多語言編輯器過程中,最困難的部分之一就是存儲過程。因為存儲過程會影響觀看和編輯的過程和體驗?,F存的 Facebook 代碼都基于一個假設,即帖子內容是只含有一種語言的單條信息。因此我們需要改變該假設,才能正確地處理含有多語言的帖子。

為此我們想出了兩種可能可行的解決方案:

級聯(concatenation)和作者翻譯(author translation)。

第一種級聯方法中,帖子中用所有語言編輯的信息都會存儲在帖子的 TAO 對象上,同時元數據的對象會包含每條信息的字符范圍信息。用這種方法編輯帖子時,還需要記錄字符范圍,以及每個范圍的變化軌跡。如果要考慮 Facebook 上所有使用過的字符設置,這個過程可能會非常有難度。

第二種作者翻譯方法中,我們會將第一條信息存儲在帖子對象 上,并為每種另外的語言單獨創建 TAO 對象,我們將這些額外的對象稱為「作者翻譯」。因為從概念上講這些對象都是作者提供的原始帖子的翻譯內容。這種編輯方法更加直接,作者能夠選擇在一篇帖子中同時編輯所有的語言版本。因此,我們決定使用作者翻譯。

然后我們需要確保,就驗證邏輯和處理邏輯而言,處理后的每條翻譯內容都像一篇帖子。這就需要研發通用接口,將存儲過程的細節從驗證邏輯中抽離出來。這種分離可以使原始帖子和作者翻譯之間的替換更加容易。我們還考慮了一個問題,如何處理一篇多語言帖子中的跨語言 mention (提到某人)。為了提高一致性,我們決定,作者翻譯不能包括原始帖子中沒有的 mention 。我們還實現了原始帖子上的一些多語言帖子元數據的緩存,以便加速時查看理解過程。

我們還必須保證,編輯器能夠妥善支持每種類型的帖子。因為包含不同的狀態更新,照片,視頻,分享內容等的帖子,可能會有不同的代碼執行流。而且,代碼還在迅速演化的代碼庫中持續不斷地變化。為了管理這些跨基礎設施的依賴性,我們為多語言編輯器支持的每種類型的帖子都開發了嚴格的集成測試。我們與產品運營和支持團隊一起努力,尋找對大多數產品使用案例來說,什么行為能產生結果,希望能夠確保多語言帖子得到妥善保存。

你的關注者會看到什么 : 選擇用哪種語言顯示帖子。

最后一個難題是,選擇哪種語言顯示帖子。得到的反饋是,大多數頁面還是偏向于向用粉絲們最熟悉的語言顯示帖子,給用戶最輕松順暢的體驗。所以我們決定讓多語種帖子的圍觀者看見他們最熟悉的語言。例如,如果一個多語種帖子用英語和西班牙語發出來,那么英語用戶看見的是英語,而西班牙語用戶看見的是西班牙語。我們根據用戶設置的語言偏好和用戶所在區域,以及他們在帖子中最常用的語言(使用樸素貝葉斯分類器來確定系統能夠識別的跨語言文本的概率分布),來決定出與帖子最相關的版本對關注者可見。如果發帖者和圍觀者使用的語言不同,那么我們就默認用發帖者的語言顯示,圍觀者可以點擊「see translation(看翻譯)」工具條來選擇自己的語言。

我們根據服務器上傳的反饋,選出對圍觀者來說最好的信息,然后上傳到客戶端。這種方式保證了在不同平臺上的體驗一致,省去了修改手機設置的麻煩。由于app更新需要一些時間,用了這種方法后,迭代也更快了,同時也支持跨平臺和舊app版本。

下一步

多語種發帖才剛剛起步。許多頁面和同行已經開發出到達多語種用戶方法—為了改變這中模式,讓我們的工具更好用,我們會不斷迭代更新我們的產品設計,為發帖者及其粉絲們提供最好的體驗。

我們還計劃使用多語種發帖來改善我們的機器翻譯的訓練數據,并向小語種用戶開放這個工具,來完善我們的機器翻譯系統。這讓我們離在Facebook上打破語言障礙又近了一步。

如何使用多語種編輯器:如果你是測試團隊的成員,可以在賬戶設置的語言設置上啟用多語種編輯器。網頁用戶可以在這里(https://www.facebook.com/help/181155025579876)找到啟用多語種編輯器指南。多語種編輯器目前只限在電腦頁面上使用,但是可以在所有平臺上顯示。

鏈接已復制,快去分享吧

企業網版權所有?2010-2024 京ICP備09108050號-6京公網安備 11010502049343號

  • <menuitem id="jw4sk"></menuitem>

    1. <form id="jw4sk"><tbody id="jw4sk"><dfn id="jw4sk"></dfn></tbody></form>
      主站蜘蛛池模板: 海淀区| 临汾市| 那曲县| 施甸县| 宜君县| 罗甸县| 五大连池市| 册亨县| 察隅县| 阳曲县| 安泽县| 嫩江县| 鄂尔多斯市| 扶风县| 远安县| 汝城县| 南木林县| 康定县| 井冈山市| 辽中县| 开封县| 越西县| 石棉县| 嘉黎县| 咸阳市| 房产| 抚松县| 曲阳县| 合肥市| 竹山县| 洞口县| 济源市| 桃江县| 莱州市| 东明县| 卢龙县| 余干县| 太仆寺旗| 枝江市| 玉林市| 曲松县|