精品国产一级在线观看,国产成人综合久久精品亚洲,免费一级欧美大片在线观看

當前位置:人工智能行業動態 → 正文

人工智能可以取代同傳翻譯嗎?

責任編輯:zsheng |來源:企業網D1Net  2019-01-03 11:53:15 本文摘自:電子產品世界

前陣子,一位同傳翻譯員聲討科大訊飛“AI同傳造假”,在網上引起了軒然大波。人工智能和同傳翻譯由此成為大家熱議的話題。今天,我們來談一談“人工智能翻譯是否真的可以取代同傳翻譯員”?

同聲傳譯有多難?

同聲傳譯最早出現在一戰后的巴黎和會上,英法兩國代表借助同聲傳譯人員的幫助,完成了緊張的談判。

如今,該技術依然在國際會議上扮演著極其重要的角色。據統計,95%的國際會議都有專業同聲傳譯人員助力。

同傳翻譯員在臺上能夠將同傳能力運用自如,需要平時大量的艱苦練習,即使是雙語運用自如的專業人員,在實戰之前,也要進行數年的鍛煉。他們不僅需要事先學習、熟悉會議資料,還需要隨機應變的能力。同聲傳譯的工作方式也比較特殊,因為壓力巨大,一般多人協同,在一場數小時的過程中,每人輪流翻譯幾十分鐘。

相較之下,普通的口譯工作則要簡單不少。機器翻譯如能代替同聲傳譯無疑具有巨大的價值。

人工智能翻譯的水平如何?

那么,人工智能同傳翻譯的能力究竟怎樣?會不會搶走同傳翻譯員的飯碗呢?

今年上半年的博鰲亞洲論壇上,首次出現了AI同傳。然而,現場配備的系統卻掉了鏈子,鬧出詞匯翻譯不準確、重復等低級錯誤。

客觀來講,人工智能或機器翻譯技術在自然語言處理上,的確有許多突破。這些突破給人希望,讓人暢想未來,但是,短期內的價值,更多體現在輔助翻譯等領域。

當然,目前機器翻譯已經取得非常大的進步,在衣食住行等常用生活用語上的中英翻譯可以達到大學六級的水平,能夠幫助人們在一些場景處理語言交流的問題,但距離人工同傳以及高水平翻譯所講究的“信、達、雅”,還存在很大的差距。

目前的差距是由現有技術水平的限制決定的,機器翻譯,又稱為自動翻譯,是利用計算機將一種語言轉換為另一種語言,機器翻譯技術的發展與計算機技術、信息論、語言學等學科的發展緊密相關。從早期的詞典匹配,到結合語言學專家梳理的知識規則,再到基于語料庫的統計學方法,隨著計算能力的提升和多語言信息的積累,機器翻譯技術開始在一些場景中提供便捷的翻譯服務。

新世紀以來,隨著互聯網的普及,互聯網公司紛紛成立機器翻譯研究組,研發了基于互聯網大數據的機器翻譯系統,從而使機器翻譯真正走向實用,市場上開始出現比較成熟的自動翻譯產品。近年來,隨著深度學習的進展,機器翻譯技術得到了進一步的發展,促進了翻譯質量的提升,使得翻譯更加地道、流暢。

機器翻譯的難點在哪里?

這里,簡單介紹一下機器翻譯的難點。整個機器翻譯的過程,可以分為語音識別轉換、自然語言分析、譯文轉換和譯文生成等階段。在此,以比較典型的、基于規則的機器同傳翻譯為例(參見下圖),模塊包含了:語音識別(語音轉換為文本)、自然語言處理(語法分析、語義分析)、譯文轉換、譯文生成和語音生成等模塊。其中的技術難點主要是:語音識別、自然語言處理和譯文轉換等步驟。

第一個技術難點是語音識別。近二十年來,語音識別技術取得了顯著進步,開始進入家電、汽車、醫療、家庭服務等各個領域。常見的應用系統有:

語音輸入系統,相對于鍵盤輸入方法,它更符合人的日常習慣,也更自然、更高效;

語音控制系統,即用語音來控制設備的運行,相對于手動控制來說更加快捷、方便,可以用在諸如工業控制、語音撥號系統、智能家電、聲控智能玩具等許多領域;

智能對話查詢系統,根據客戶的語音進行操作,為用戶提供自然、友好的數據庫檢索服務,例如家庭服務、旅行社服務系統、訂票系統、銀行服務等。

可以說,語音識別技術與其他自然語言處理技術相結合,可以構建出很多復雜的應用。

然而,語音識別的主要難點就是對自然語言的識別和理解。首先必須將連續的講話分解為詞、音素等單位,其次要建立一個理解語義的規則。由于語音信息量大,語音模式不僅對不同的說話人不同,對不同場景的同一說話人也是有差異的。

例如,一個人在隨意說話和認真說話時的語音特征是不同的。另外,說話者在講話時,不同的詞可能聽起來是相似的,這也是常見現象。單個字母或詞、字的語音特性,受上下文的影響,以致改變了重音、音調、音量和發音速度等。最后,環境噪聲和干擾對語音識別也有較大影響,致使識別率低。

第二個技術難點是語義解析,這是智能化的機器翻譯系統的核心部分。目前,機器翻譯系統可劃分為基于規則和基于語料庫兩大類。前者以詞典和語言知識規則庫為基礎;后者由經過劃分并具有標注的語料庫構成知識源,以統計學的算法為主。

機譯系統是隨著語料庫語言學的興起而發展起來的。目前,世界上絕大多數機譯系統都采用以規則庫為基礎的策略,一般分為語法型、語義型、知識型和智能型。不同類型的機譯系統,由不同的成分構成。抽象地說,所有機譯系統的處理過程都包括以下步驟:對源語言的分析或理解,在語言的語法、語義和語用等平面進行轉換,按目標語言結構規則生成目標語言。

當前,Google 的在線翻譯已經為人熟知,其第一代的技術即為基于統計的機器翻譯方法,基本原理是通過收集大量的雙語網頁作為語料庫,然后由計算機自動選取最為常見的詞與詞的對應關系,最后給出翻譯結果。

不過,采用該技術目前仍無法達到令人滿意的效果,經常鬧出各種翻譯笑話。因為,基于統計的方法,需要建立大規模的雙語語料庫,而翻譯模型、語言模型參數的準確性直接依賴于語料的規模及質量,翻譯質量直接取決于模型的質量和語料庫的覆蓋面。

除了上述傳統的方式,2013年以來,隨著深度學習的研究取得較大進展,基于人工神經網絡的機器翻譯逐漸興起。就當前而言,廣泛應用于機器翻譯的是長短時記憶循環神經網絡。該模型擅長對自然語言建模,把任意長度的句子轉化為特定維度的浮點數向量,同時“記住”句子中比較重要的單詞,讓“記憶”保存比較長的會話時間。該模型較好地解決了自然語言句子向量化的難題。

其技術核心是通過多層神經網絡,自動從語料庫中學習知識。一種語言的句子被向量化之后,在網絡中層層傳遞,經過多層復雜的傳導運算,生成譯文。這種翻譯方法最大的優勢在于譯文流暢,更加符合語法規范。相比之前的翻譯技術,質量有較高的提升。

智能同傳翻譯離我們還有多遠?

需要說明的是,很多人對機器翻譯有誤解,認為機器翻譯偏差大。其實,機器翻譯運用語言學知識,自動識別語法,模擬語義理解,進行對應翻譯,因語法、語義、語用的復雜性,出現錯誤是難免的。就已有的成果來看,全場景通用的機器翻譯,其翻譯質量離終極目標仍相差甚遠。

隨著全球化網絡時代的到來,語言障礙已經成為二十一世紀社會發展的重要瓶頸,實現任意時間、任意地點、任意語言的無障礙自由溝通是人類追求的一個夢想。這僅是全球化背景下的一個小縮影。在社會快速發展的進程中,機器翻譯將扮演越來越重要的角色。

關鍵字:智能

本文摘自:電子產品世界

x 人工智能可以取代同傳翻譯嗎? 掃一掃
分享本文到朋友圈
當前位置:人工智能行業動態 → 正文

人工智能可以取代同傳翻譯嗎?

責任編輯:zsheng |來源:企業網D1Net  2019-01-03 11:53:15 本文摘自:電子產品世界

前陣子,一位同傳翻譯員聲討科大訊飛“AI同傳造假”,在網上引起了軒然大波。人工智能和同傳翻譯由此成為大家熱議的話題。今天,我們來談一談“人工智能翻譯是否真的可以取代同傳翻譯員”?

同聲傳譯有多難?

同聲傳譯最早出現在一戰后的巴黎和會上,英法兩國代表借助同聲傳譯人員的幫助,完成了緊張的談判。

如今,該技術依然在國際會議上扮演著極其重要的角色。據統計,95%的國際會議都有專業同聲傳譯人員助力。

同傳翻譯員在臺上能夠將同傳能力運用自如,需要平時大量的艱苦練習,即使是雙語運用自如的專業人員,在實戰之前,也要進行數年的鍛煉。他們不僅需要事先學習、熟悉會議資料,還需要隨機應變的能力。同聲傳譯的工作方式也比較特殊,因為壓力巨大,一般多人協同,在一場數小時的過程中,每人輪流翻譯幾十分鐘。

相較之下,普通的口譯工作則要簡單不少。機器翻譯如能代替同聲傳譯無疑具有巨大的價值。

人工智能翻譯的水平如何?

那么,人工智能同傳翻譯的能力究竟怎樣?會不會搶走同傳翻譯員的飯碗呢?

今年上半年的博鰲亞洲論壇上,首次出現了AI同傳。然而,現場配備的系統卻掉了鏈子,鬧出詞匯翻譯不準確、重復等低級錯誤。

客觀來講,人工智能或機器翻譯技術在自然語言處理上,的確有許多突破。這些突破給人希望,讓人暢想未來,但是,短期內的價值,更多體現在輔助翻譯等領域。

當然,目前機器翻譯已經取得非常大的進步,在衣食住行等常用生活用語上的中英翻譯可以達到大學六級的水平,能夠幫助人們在一些場景處理語言交流的問題,但距離人工同傳以及高水平翻譯所講究的“信、達、雅”,還存在很大的差距。

目前的差距是由現有技術水平的限制決定的,機器翻譯,又稱為自動翻譯,是利用計算機將一種語言轉換為另一種語言,機器翻譯技術的發展與計算機技術、信息論、語言學等學科的發展緊密相關。從早期的詞典匹配,到結合語言學專家梳理的知識規則,再到基于語料庫的統計學方法,隨著計算能力的提升和多語言信息的積累,機器翻譯技術開始在一些場景中提供便捷的翻譯服務。

新世紀以來,隨著互聯網的普及,互聯網公司紛紛成立機器翻譯研究組,研發了基于互聯網大數據的機器翻譯系統,從而使機器翻譯真正走向實用,市場上開始出現比較成熟的自動翻譯產品。近年來,隨著深度學習的進展,機器翻譯技術得到了進一步的發展,促進了翻譯質量的提升,使得翻譯更加地道、流暢。

機器翻譯的難點在哪里?

這里,簡單介紹一下機器翻譯的難點。整個機器翻譯的過程,可以分為語音識別轉換、自然語言分析、譯文轉換和譯文生成等階段。在此,以比較典型的、基于規則的機器同傳翻譯為例(參見下圖),模塊包含了:語音識別(語音轉換為文本)、自然語言處理(語法分析、語義分析)、譯文轉換、譯文生成和語音生成等模塊。其中的技術難點主要是:語音識別、自然語言處理和譯文轉換等步驟。

第一個技術難點是語音識別。近二十年來,語音識別技術取得了顯著進步,開始進入家電、汽車、醫療、家庭服務等各個領域。常見的應用系統有:

語音輸入系統,相對于鍵盤輸入方法,它更符合人的日常習慣,也更自然、更高效;

語音控制系統,即用語音來控制設備的運行,相對于手動控制來說更加快捷、方便,可以用在諸如工業控制、語音撥號系統、智能家電、聲控智能玩具等許多領域;

智能對話查詢系統,根據客戶的語音進行操作,為用戶提供自然、友好的數據庫檢索服務,例如家庭服務、旅行社服務系統、訂票系統、銀行服務等。

可以說,語音識別技術與其他自然語言處理技術相結合,可以構建出很多復雜的應用。

然而,語音識別的主要難點就是對自然語言的識別和理解。首先必須將連續的講話分解為詞、音素等單位,其次要建立一個理解語義的規則。由于語音信息量大,語音模式不僅對不同的說話人不同,對不同場景的同一說話人也是有差異的。

例如,一個人在隨意說話和認真說話時的語音特征是不同的。另外,說話者在講話時,不同的詞可能聽起來是相似的,這也是常見現象。單個字母或詞、字的語音特性,受上下文的影響,以致改變了重音、音調、音量和發音速度等。最后,環境噪聲和干擾對語音識別也有較大影響,致使識別率低。

第二個技術難點是語義解析,這是智能化的機器翻譯系統的核心部分。目前,機器翻譯系統可劃分為基于規則和基于語料庫兩大類。前者以詞典和語言知識規則庫為基礎;后者由經過劃分并具有標注的語料庫構成知識源,以統計學的算法為主。

機譯系統是隨著語料庫語言學的興起而發展起來的。目前,世界上絕大多數機譯系統都采用以規則庫為基礎的策略,一般分為語法型、語義型、知識型和智能型。不同類型的機譯系統,由不同的成分構成。抽象地說,所有機譯系統的處理過程都包括以下步驟:對源語言的分析或理解,在語言的語法、語義和語用等平面進行轉換,按目標語言結構規則生成目標語言。

當前,Google 的在線翻譯已經為人熟知,其第一代的技術即為基于統計的機器翻譯方法,基本原理是通過收集大量的雙語網頁作為語料庫,然后由計算機自動選取最為常見的詞與詞的對應關系,最后給出翻譯結果。

不過,采用該技術目前仍無法達到令人滿意的效果,經常鬧出各種翻譯笑話。因為,基于統計的方法,需要建立大規模的雙語語料庫,而翻譯模型、語言模型參數的準確性直接依賴于語料的規模及質量,翻譯質量直接取決于模型的質量和語料庫的覆蓋面。

除了上述傳統的方式,2013年以來,隨著深度學習的研究取得較大進展,基于人工神經網絡的機器翻譯逐漸興起。就當前而言,廣泛應用于機器翻譯的是長短時記憶循環神經網絡。該模型擅長對自然語言建模,把任意長度的句子轉化為特定維度的浮點數向量,同時“記住”句子中比較重要的單詞,讓“記憶”保存比較長的會話時間。該模型較好地解決了自然語言句子向量化的難題。

其技術核心是通過多層神經網絡,自動從語料庫中學習知識。一種語言的句子被向量化之后,在網絡中層層傳遞,經過多層復雜的傳導運算,生成譯文。這種翻譯方法最大的優勢在于譯文流暢,更加符合語法規范。相比之前的翻譯技術,質量有較高的提升。

智能同傳翻譯離我們還有多遠?

需要說明的是,很多人對機器翻譯有誤解,認為機器翻譯偏差大。其實,機器翻譯運用語言學知識,自動識別語法,模擬語義理解,進行對應翻譯,因語法、語義、語用的復雜性,出現錯誤是難免的。就已有的成果來看,全場景通用的機器翻譯,其翻譯質量離終極目標仍相差甚遠。

隨著全球化網絡時代的到來,語言障礙已經成為二十一世紀社會發展的重要瓶頸,實現任意時間、任意地點、任意語言的無障礙自由溝通是人類追求的一個夢想。這僅是全球化背景下的一個小縮影。在社會快速發展的進程中,機器翻譯將扮演越來越重要的角色。

關鍵字:智能

本文摘自:電子產品世界

電子周刊
回到頂部

關于我們聯系我們版權聲明隱私條款廣告服務友情鏈接投稿中心招賢納士

企業網版權所有 ©2010-2024 京ICP備09108050號-6 京公網安備 11010502049343號

^
  • <menuitem id="jw4sk"></menuitem>

    1. <form id="jw4sk"><tbody id="jw4sk"><dfn id="jw4sk"></dfn></tbody></form>
      主站蜘蛛池模板: 海阳市| 昌邑市| 贡觉县| 建平县| 和平区| 库尔勒市| 深圳市| 微博| 甘南县| 西充县| 丽江市| 开远市| 文昌市| 澄迈县| 莱西市| 吉林省| 洛阳市| 武乡县| 龙州县| 鹿泉市| 唐河县| 扶风县| 平陆县| 将乐县| 若尔盖县| 道真| 晋城| 江山市| 沙洋县| 红原县| 桐梓县| 景泰县| 乌什县| 于田县| 罗甸县| 荥阳市| 霸州市| 吴旗县| 敦化市| 交口县| 沂水县|