《連線》雜志主編凱文·凱利說,機(jī)器人真正的變革還沒有到來,或許是因?yàn)槿藱C(jī)交互的方式還沒有徹底改變,大多數(shù)時候我們還需要通過打字或手寫輸入命令,如果機(jī)器人能聽懂人話,世界將變成什么樣?
昨天,21個項(xiàng)目獲得了第四屆“吳文俊人工智能科學(xué)技術(shù)獎”,其中上海交通大學(xué)和蘇州思必馳信息科技有限公司合作開發(fā)的“面向口語教育的智能語音技術(shù)及云服務(wù)平臺”獲得進(jìn)步獎二等獎,這個能聽懂人話的平臺以及背后攜風(fēng)雨之勢而來的語音產(chǎn)業(yè),或許預(yù)示著我們離“巨變”并不遙遠(yuǎn)。
互聯(lián)網(wǎng)領(lǐng)域的“慢”行業(yè)
相比移動互聯(lián)網(wǎng)行業(yè)的嘈雜,智能語音行業(yè)的發(fā)展簡直可以用慢來形容,沒有公關(guān)戰(zhàn)、沒有BAT領(lǐng)頭、至今也沒出現(xiàn)“船票”級產(chǎn)品。然而,上海交通大學(xué)智能人機(jī)交互研究所的研究員俞凱,前年在廣東湛江做的一個試驗(yàn),分明讓人體會到了語音產(chǎn)業(yè)的進(jìn)步。在這個實(shí)驗(yàn)中,一臺機(jī)器人和幾十位老師分成兩組,分別為相同數(shù)量的學(xué)生的英語口語打分,結(jié)果顯示,機(jī)器人打分抽查滿意度98%,與教師組一致率為99.8%。
機(jī)器人的優(yōu)勢還在于速度,俞凱說,如果按湛江11.7萬考生參加英語口語測試計算,需要100位老師忙活12天,但用上機(jī)器人,只要2天。
目前,能提供這項(xiàng)語音服務(wù)的除了俞凱所在的上海交大,還有脫身于中國科技大學(xué)的科大訊飛,后者作為中國最早出現(xiàn)的語音類企業(yè),卻沒有及時發(fā)展成一家互聯(lián)網(wǎng)企業(yè),事實(shí)上,這個圈子中的大多企業(yè)主要營收仍然來自軟件授權(quán),因此這些年并沒有出現(xiàn)爆炸式增長。
不過,中國工程院院士、中國人工智能學(xué)會理事長李德毅卻直言,“慢”并不會持續(xù)太久,語音類產(chǎn)業(yè)必將迅速崛起,這是大數(shù)據(jù)的下一座“金礦”。
將出現(xiàn)顛覆性的成果
機(jī)器人是怎樣為學(xué)生打分的?其實(shí)他們只是事先學(xué)習(xí)了各位老師的打分方法:將某位老師的全部打分記錄灌入機(jī)器人的“大腦”中,它就能分析出這位老師的打分習(xí)慣,當(dāng)機(jī)器人的“大腦”中存儲了多位老師的“習(xí)慣”后,它就能代替老師打分了。
這個過程有點(diǎn)像某家語音企業(yè)讓機(jī)器人“學(xué)習(xí)”了鄧麗君的所有歌聲,再以鄧麗君的方式唱出新歌,又或者和英國影片《黑鏡子》中的那樣,當(dāng)某人在社交網(wǎng)站上留下了足夠多的可供“學(xué)習(xí)”的音頻,當(dāng)他去世后,他的家人就能用軟件合成他的聲音以供慰藉。
俞凱透露,僅就機(jī)器人英語能力評估領(lǐng)域,目前的市場規(guī)模就在十幾億,而在語言識別、合成以及情緒和重音的識別技術(shù)都已成熟的情況下,他正在努力開拓更多新市場。
讓機(jī)器人更“人性化”
中國已成為世界最大的機(jī)器人市場,但去年也只銷售了3萬多臺,新松機(jī)器人自動化股份有限公司總裁曲道奎說,工業(yè)機(jī)器人的市場其實(shí)有限,現(xiàn)在全世界的眼光都盯著家用機(jī)器人市場。
要讓機(jī)器人走進(jìn)家庭還得更“人性化”,除了更精準(zhǔn)的紅外定位、更靈敏的傳感器外,語言識別是給人們帶來良好體驗(yàn)不可或缺的因素。
俞凱在手機(jī)上打開他們研發(fā)的一款名為“語音輸入板”的APP,當(dāng)某人的話音剛落,語音就轉(zhuǎn)換成文字在屏幕上顯示出來,這款軟件能夠做到自動收集人們的表達(dá)習(xí)慣,從而形成更高的辨識度,當(dāng)移植到機(jī)器人上時,機(jī)器人就能更好地識別主人的指令;另一方面,當(dāng)越多人下載這款A(yù)PP,收集到的語言信息形成的大數(shù)據(jù)平臺,也將為后期的產(chǎn)品開發(fā)帶來便利。