總之和你看到的演示視頻不太一樣
前兩天,微軟Skype Translator進行公開試用,Windows 8.1和Windows10內測用戶不需要申請就可以在應用商店下載試用。
于是在辦公室,我們找到了兩臺運行 Windows 8.1系統的電腦,并裝上Skype Translator預覽版進行測試(Windows 10測試版下載后無法打開,一直在轉圈圈)。
然而,從最終的結果看來,Skype Translator的實時翻譯沒有演示視頻那么令人驚艷,效果也遠遠沒達到我們的預期。但Skype將語音識別、文字翻譯和語音合成三個步驟進行壓縮所達到的“實時”效果,對跨語言溝通意義非凡,微軟在產品的打磨上仍然需要時間,畢竟這還牽涉到機器學習的問題。
在應用商店安裝、打開應用后,通話對象的頭像下面會有一個翻譯的按鈕,打開后便可以設置雙方的語言。
在進行語音/視頻對話時,翻譯文本會實時呈現在右側的對話框內,然后語音播放,就和同聲傳譯一樣。此外,Skype Translator會把整個對話內容記錄下來,用于機器學習以不斷提高語音識別和文本翻譯的質量。
首先我們使用了新概念教材朗讀、雷軍媒體見面的錄音進行測試,由于Skype Translator對一大段話的識別效果太差,后來我們采取了播一句,按一次暫停的辦法。準確性的結果如下(括號內為最終翻譯出來的英文):
雷軍采訪:雷軍:排得太長的了呢,我們團隊都疏導了,就說你們還是在網上買。
Skype:還在網上買(Buy it on the Internet.)
雷軍:那么在小米網預約的人呢也超過了100萬人。
Skype:超過了1000000.(More than 1000000.)
雷軍:所以呢我覺得作為頂配的首發第一站來看的話,我覺得這個結果超出我想象。
Skype:我覺得作為.(I think, as.)
其實我們也試了Are you OK?但完全沒法識別。
新概念:
新概念:Did the detective saved the diamond?
Skype: To look at this problem(給看我這只筆問題)
新概念:The plane was late, and the detective were waiting at the airport all morning.
Skype:Call caofeidian game called my friends(打給曹妃甸賽打給我的網友)
新概念:A few hours earlier, someone had told the police that the thieves were try to steal the diamond.
Skype: Phone card shopping mall(手機卡商場)
從目前的翻譯結果來看,Skype Translator語音識別的準確性不穩定。我和同事的日常對話也很難正常記錄,基本上語速稍快就會丟字。
即便是識別率較高的中文,也會鬧出一些笑話,例如在我與另一位作者的日常對話中,“不在辦公室”,卻識別成了“我在辦公室”,所以一字一句地發音,識別的準確性就會顯著提高,截圖最后一句話充分表達了我的心情——幾乎是崩潰的,:)。
假如你兩種語言夾雜著用,它依然會按照之前設置的“使用語言”進行識別,即使你說的是中文,它也會以為你講的是英語,識別結果自然大相徑庭。
經過各種測試之后,我們得出Skype Translator預覽版的大致效果如下:
短句子>長句子
環境安靜>環境嘈雜
中文識別>英文識別
文本對話>視頻語音對話
盡管測試結果不是特別讓人滿意,但畢竟它還只是個預覽版。Google說現在的語音識別準確性已經可以達到92%,所以測試中出現的語音識別問題從技術上來說問題不大,而且相比普遍配有兩三個麥克風過濾噪音的智能手機,電腦的效果也差得多。也許我們可以期待一下移動版的效果。
但即便解決了識別,以今天Bing翻譯、Google翻譯的水平,談笑風生怕是也有點難。