2014年,大數據開始由概念走向應用,并因此推動各行業進軍互聯網出現跨越式發展,大數據中迸發商機和創造價值的能力越來越凸顯。隨著各種基于數據的商業模式被設計出來,大數據將在全球、全社會的各個領域,如金融、制造、能源、商貿、物流、農業、語言服務等方面不斷走向實用。
在這個追求速度第一的信息時代,人工翻譯的高成本和低產出已無法滿足市場巨大的翻譯量以及快速翻譯的需求。
翻譯行業也經過了多年蛻變,為了向國際化靠攏,滿足翻譯市場中各個角色不斷進化的需求,對于用戶來說,對翻譯速度、翻譯數量、翻譯質量的要求,或譯者和專家對翻譯資源零散、匱乏;翻譯學習;翻譯工具等的需求,語言服務這一項傳統行業為了更好的與時俱進,將創新科技融入語言服務領域,與大數據、云計算完美融合才是未來發展趨勢。
在各類使用人群市場需求和互聯網技術的日新月異推動了傳統語言產品與服務的發展,并催生了一批建立在新的語言處理技術上的新產品,如Google新開發的譯圖技術、Skype推出的多語即時聊天功能等,譯庫也是在此浪潮的推動下應運而生的開放式語言資產工具平臺。
譯庫區別于市面上單一翻譯等產品,最亮點體現于通過大數據、云計算、深度學習等核心技術,進行資源整合,解決一直阻礙著商業效能提高的數據孤島問題。譯庫是為了譯者和語言愛好者提供的開放式、系統化翻譯工具包,它融合了以往單一語言服務產品的功能和特點,通過提供完善的免費工具、開放共享的資源為互聯用戶提供更加高效便捷的服務,滿足市場快速、高效、高質的翻譯需求,推動語言服務業的創新發展。
譯庫主要包括機器翻譯、CAT輔助翻譯、平行文本、語言資產管理四大工具,其功能特點主要有以下四個方面:
1.分領域多語機器翻譯
譯庫為譯者提供分專業領域的機器翻譯,在專業語料大數據的支持下進一步提高翻譯質量。與此同時,用戶還可以修正機器翻譯的結果,譯庫能夠自動學習用戶貢獻的正確知識,在今后的翻譯中繼續提高翻譯質量。
2.開放式語言資產共享
平行語料庫、術語庫、翻譯記憶庫等都是語言資產的管理的內容,互聯網上并不缺乏這樣的數據,但這些數據通常零散分布而無法得到有效的利用。譯庫整合了各種語料資源并進行專業加工,最終匯聚成一個億級資源的專業語料庫。
同時,基于語言資產共享這個語言產業資源的發展趨勢,譯庫開創了開放式語言大數據資源共享交換平臺,用戶可以在線使用自己的語言資源提高翻譯效率,也可以上傳、分享自己的語言資產并交換,平臺還提供語言資源的管理、檢索、分享、交換和評價工具。
3.開放式計算機輔助翻譯(CAT)
譯庫的CAT工具不同于單純的人工翻譯或機器翻譯,它是在人機共同參與下完成翻譯的整個項目,方便譯者或學習者在翻譯過程中,減少對文檔本身的工作,更優質、高效、輕松地完成翻譯項目。用戶在利用該工具進行在線翻譯和翻譯管理的同時,還可以在線調用開放式語言資產更優化翻譯質量。
4.平行文本
譯庫的平行文本把眾多類似的語句搜集起來,主要是為了專業翻譯人員用于更深入地理解原文和譯文,或為學習者提供參考或學習之用。
在當今資源共享、用戶生成內容為趨勢的互聯網時代,諸如譯庫這類的語言服務平臺是為了順應翻譯產業的發展需要而進行的技術創新。語言服務產業應在互聯網技術的推動下,不斷地積極尋求業務模式和技術技能的突破與創新,更好地滿足客戶的需求,獲得進一步的發展。