微軟的一個研究團(tuán)隊在開發(fā)語音識別技術(shù)方面取得了新成果,在語音識別準(zhǔn)確率上面超過了IBM的超級電腦沃森。微軟將其語音識別技術(shù)的出錯率降到了6.3%,打破了沃森之前保持的6.9%的出錯率紀(jì)錄。
微軟的目標(biāo)是讓計算機(jī)能夠理解語言以及人的意圖,從而幫助它改進(jìn)Cortana、Skype Translator和其他跟語言有關(guān)的服務(wù)。它在語音識別技術(shù)準(zhǔn)確性上的突破讓它朝著這個目標(biāo)又邁進(jìn)了一步。
語音將成為一種主流計算界面。數(shù)字化語音助手比如蘋果的Siri已經(jīng)成為移動設(shè)備生態(tài)系統(tǒng)的一個組成部分,但是這項技術(shù)的執(zhí)行速度仍然較慢,而且出錯率比較高。現(xiàn)在,搜索功能和語言理解方面的技術(shù)研發(fā)取得了一些突破性成果,極大地提高了語音助手的準(zhǔn)確率和便利性。
為了在這場技術(shù)革命中處于領(lǐng)先的位置,很多技術(shù)公司包括亞馬遜、蘋果、谷歌和IBM都已經(jīng)開始面向消費(fèi)者提供語音識別技術(shù)。例如,蘋果在Siri中添加了第三方整合功能,允許它與第三方應(yīng)用通訊。這意味著用戶們將可以利用Siri服務(wù)呼叫Uber專車。
然而,要想成為消費(fèi)者最主要的計算平臺,語音助手仍需進(jìn)一步改進(jìn)和完善。據(jù)凱鵬華盈分析師瑪麗·米克爾(Mary Meeker)稱,語音識別的準(zhǔn)確率必須達(dá)到99%左右(現(xiàn)在大約是90%),語音指令才能成為最有效的計算輸入形式。
與此同時,還沒有或者不打算投資語音技術(shù)的公司可能必須承擔(dān)被競爭對手甩在身后的風(fēng)險。Facebook的Messenger副總裁大衛(wèi)·馬科斯(David Marcus)最近在TechCrunch Disrupt大會上接受采訪時重申了這一點。馬科斯承認(rèn),F(xiàn)acebook目前仍把重點放在文本上面,這可能會讓它無緣參與語音識別技術(shù)領(lǐng)域的競爭。