企業網D1Net導語:在智能語音市場,巨頭紛爭,各顯神通,蘋果有Siri,谷歌推“OKGoogle”,微軟劍走偏鋒,直指實時翻譯,可見,智能語音市場已經成為IT界的下一個金礦。
隨著移動互聯網發展,語音交互的重要性尤為突出,語音市場已經成為兵家必爭之地,市場上掀起“圈地運動”。蘋果的Siri已經廣為人知;谷歌日前發布的“OKGoogle”,語音控制命令就成為一大亮點。而微軟則在實時翻譯領域另辟蹊徑。
日前,在微軟亞洲研究院舉辦的“創新日”活動上,微軟也亮出其智能語音技術的最新成果:“實時語音翻譯系統”和“基于Kinect的手語翻譯系統”。微軟亞洲研究院院長洪小文表示,跨語種溝通,以及聾啞患者與正常人之間的溝通,目前還處于初級的靠人翻譯的階段,溝通成本極高。如果能從技術上解決這一問題,不但能極大地便利人們的生產生活,也有著巨大的商業潛力。
微軟發力“智能語音”
智能語音市場被視為IT界的下一個金礦,蘋果、谷歌等IT巨頭早已在這個領域布局卡位,國內的科大訊飛、云知聲也在覬覦這塊市場。對于微軟來說,自然不會對這個市場無動于衷。
在日前微軟亞洲研究院舉辦的“創新日2013”活動上,記者見證了精彩一幕:借助微軟的“實時語音翻譯系統”,微軟亞洲研究院院長洪小文以中文和其說英語的同事、來自紐約長島的麥特實現了順暢的交流。更讓人叫絕的是,這套系統還能夠將洪小文講中文的發音、語調,轉換成英文的發音、語調,個性十足,而不是想象中或者科幻影視劇中干巴巴的機器人語言。
除了實時語音翻譯系統”之外,微軟另一項“基于Kinect的手語翻譯系統”技術也備受關注。據悉,該系統由微軟亞洲研究院與中國科學院和北京聯合大學合作開發,借助K inect設備對手語進行識別和翻譯,同時支持對漢語手語和英語手語的識別與翻譯,并能將文本信息反向翻譯為手語,可幫助不同文化和語言背景的聽障人士實現“發聲”夢想。
基礎性研究亟待商業化
洪小文告訴南都記者,這次展示的“實時語音翻譯系統”和“基于Kinect的手語翻譯系統”,都是微軟與合作伙伴一起,在大量基礎性研究基礎上,推出的應用成果。不過,洪小文也承認,由于技術還在研發過程中,有些翻譯會出點錯誤。但隨著技術的逐步成熟,人們將不會再面臨因為語言不通而無法溝通的困境。“這些成果一旦技術成熟,就將產業化,為消費者服務。”
作為微軟在美國本土以外規模最大的基礎研究機構,微軟亞洲研究院一直致力于從事計算機基礎研究。截至目前,微軟亞洲研究院擁有360多項技術轉化,孵化出微軟亞洲工程院、微軟亞洲搜索技術中心等重要機構。洪小文表示,信息技術的革命對人類生活方式的影響堪稱深刻和神奇,飛速進化的計算能力、不斷降低的計算體驗成本讓人們能夠通過智能終端和互聯網達成工作、娛樂、溝通等各種目的。人機界面、云計算、大數據、機器學習、人工智能……許許多多新型設備之所以能夠問世,能夠為人們所接受和喜愛,其實都離不開計算機基礎科學在背后的支撐。