隨著移動互聯網、智能終端、云計算的飛速發展,智能人機交互(HCI)技術也迎來了大爆發的時代。那么,新的產業變革給智能人機交互技術帶來了哪些新的挑戰和機遇?智能人機交互技術如何才能更好地實現產業化發展?中國企業為迎接智能人機交互時代的到來又做了哪些準備呢?
對于上述問題,北京捷通華聲語音技術有限公司(下稱“捷通華聲”)董事長張連毅在接受C114專訪時為我們進行了詳細解讀。
HCI技術大爆發:捷通華聲推靈云平臺
當前,語音合成、語音識別和手寫識別已經成為智能人機交互的三項核心技術,正在悄悄地影響和改變著人們的生活。其中,語音合成技術可以讓各種設備“開口講話”,把各種文本信息以語音的方式播報;語音識別技術可以讓各種設備“聽懂”我們的話;手寫識別技術可以幫助人們從各種設備中繁瑣的按鍵操作中解脫出來,輕松輸入文字。
而在張連毅看來,隨著移動互聯網、智能終端、云計算的飛速發展,智能人機交互技術也迎來了大爆發的時代。他認為,“智能人機交互技術是各大技術產業變革的畫龍點睛之作,也是我國由‘中國制造’向‘中國創造’轉型的巨大機遇,中國在智能人機交互技術領域的起步絕不輸于外國企業。”
據張連毅介紹,捷通華聲憑借十多年來在智能人機交互技術、移動互聯網領域的雄厚積累,于2011年推出了全球第一個全方位智能人機交互感知云——靈云平臺,為從“中國制造”向“中國創造”的全面升級提供了一個強大的“發動機”引擎;隨后,又經過各方面的應用探索,于2012年再次推出了靈云平臺2.0版本。
目前,靈云平臺主要有語音合成(TTS)、語音識別(ASR)、手寫識別(HWR)、光學字符識別(OCR)、自然語言理解(NLU)這五項核心技術,為不同領域、行業、企業,乃至個人用戶,提供了多種智能人機交互解決方案,包括無紙化辦公方案、電子簽批方案、電子表單處理方案、語音技術方案、智能客服系統方案等,為企業高效辦公、人們便捷生活提供強有力的技術保障。
靈云平臺的客戶不僅涵蓋了政府、教育、金融、電信、能源、交通、醫療等傳統行業領域的客戶,更有智能家電、智能家居、互聯網及移動互聯網、智慧城市等新興領域的用戶。例如,目前捷通華聲已將靈云平臺與中國電信正在開發的EMP平臺實現無縫銜接,成為其開放平臺的重要組成部分,而捷通華聲則負責提供其中的人機交互技術支持;此外,捷通華聲靈云平臺技術還應用到了百度語音助手等軟件平臺。
推動技術成熟完善:靈云開發者社區即將開放
相關數據顯示,捷通華聲已在國內語音識別、手寫識別、模式識別技術市場占有了較大的市場份額,2010年世博會廣播系統的語音技術80%是由捷通華聲提供支持,全國的高鐵所有站臺的信息播報系統,都是采用捷通華聲的語音合成技術。
雖然,捷通華聲在智能人機交互技術領域已經成為領先廠商,但捷通華聲在該領域的耕耘遠不止于此。張連毅指出,“雖然智能人機交互技術已經取得了非常廣泛的應用,但其技術本身還存在一些不完善的地方,例如語音識別率還不能做到百分之百,語音合成雖然已經可以流利地學習人講話,但講話的語氣及感情色彩相比真人還有一定差距。”
因此,業界還需要去不斷學習、了解、應用、完善好這些智能人機交互技術,這需要整個產業來推動其發展。張連毅透露,“為此,捷通華聲的靈云開發者社區決定在今年7月18日向整個社會全方位開放各項能力,所有的企業和個人開發者都可以免費加入到靈云開發者社區。”
“在靈云開發者社區,企業和個人開發者均可直接下載語音合成(TTS)、語音識別(ASR)、手寫識別(HWR)、光學字符識別(OCR)等多項HCI核心技術。與此同時,捷通華聲還將加強技術指導,幫助開發者把不同的智能人機交互技術應用到產品上,與企業和個人開發者共同了解、學習、切磋、完善各種智能人機交互技術。”張連毅說。
據了解,靈云開發者社區作為捷通華聲靈云平臺的門戶,是整個靈云平臺非常重要的一部分。開發者社區將靈云平臺的所有能力全部開放給用戶,讓用戶可以自主的選擇需要的能力去創造想要的產品,大到平臺級智能人機交互多種能力的需求,小到個人開發者擁有的開發夢想,靈云平臺都可以滿足。
“在這里,開發者可以享受多能力支持服務、相互交流開發心得、創造多能力集合產品并上線產品。更為重要的是,通過開發者社區利用靈云平臺的多種能力,開發者可結合自己的創造力,創造出各種新型的智能人機交互產品,這不僅有利于服務大眾創造價值,還能夠共同推動智能人機交互技術產業的發展。”張連毅強調,開發者社區是一個充滿創造的世界,在這里通過我們共同的努力能夠完成由“中國制造”到“中國創造”的完美轉變,靈云開發者社區歡迎每一位企業和個人開發者的加入。
面對競爭:開放與合作可獲雙贏
除了通過靈云開發者社區來不斷完善智能人機交互技術以外,捷通華聲對于整個產業的發展也有著自己的獨到見解。當前,智能人機交互技術早已不是什么新鮮事,微軟、百度、谷歌、騰訊等公司都已進入這個領域并有很強的研發實力,而作為專業的HCI技術提供商,科大訊飛、漢王等公司在各單項技術領域也獲得了不錯的成績,智能人機交互產業迎來了群雄并起的時代。
在張連毅看來,智能人機交互技術正在迎來產業新的發展機遇。面對競爭對手的沖擊,捷通華聲會坦然面對這種競爭,并且繼續開放智能人機交互技術的各種能力,憑借近20年在這個領域的積累繼續完善技術,同時與業界保持密切的合作,以保持自身技術的領先性。
“毫無疑問,采取排斥和封閉的態度并不有利于智能人機交互技術產業的良性發展。”張連毅表示,“正如靈云平臺定位于智能人機交互技術的能力開放服務平臺一樣,我們希望通過靈云平臺向所有能夠使用智能人機交互技術的廠商和開發者,提供全方位的核心技術能力;此外,捷通華聲還會加強與業界合作伙伴乃至競爭對手的溝通與合作,共同把產業做大做強。”
例如,一直以來捷通華聲與百度公司都保持著良好的合作伙伴關系。前不久,為促進雙方在智能人機交互核心技術與產品等方面的合作,百度公司投資入股捷通華聲。張連毅認為,此次戰略合作,不僅對百度廣泛應用語音合成、手寫識別等技術形成支撐,也將對捷通華聲智能人機交互技術的廣泛應用與市場拓展產生非常大的促進作用。
北京捷通華聲語音技術有限公司董事長 張連毅