在人工智能領域,場景應用、平臺建設是并行的,如何打通多項AI能力,提供融合的智能服務,對國內AI企業提出了挑戰。捷通華聲作為國內人工智能產業的開拓者與領導者,早在2011年就推出了全球首個全方位人工智能平臺——靈云(AIcloud.com)。該平臺融合智能語音、智能圖像、生物特征識別、智能語義等12項人工智能技術,并面向產業全面開放。為此,作為中國軟件網策劃的“2018中國AI應用、平臺與生態”系列專訪第二期,我們采訪了捷通華聲總經理武衛東,跟他聊一聊人智能應用和人工智能開放平臺的發展邏輯,以及捷通華聲的一些實踐經驗。
深化應用、構建平臺,是人工智能廠商的未來
根據中國軟件網《2017中國AI應用、平臺與生態洞見報告》中調研數據顯示,38%的人認為我國人工智能產業目前處于應用擴展、平臺建設階段;33%的人認為我國人工智能產業已經進入平臺競爭、生態建設階段。可見,大部分人都認為我國正在進行AI平臺和生態建設。值得提出的是,應用落地和平臺、生態建設是同步并舉,人工智能廠商之間的競爭將在多個維度同時進行。要建成完善的AI平臺和生態,預計還有5~10年時間。
武衛東認為,通過構建人工智能開放平臺的方式,深化行業應用、聚集合作伙伴,進而構建人工智能產業生態是捷通華聲重要的戰略布局。捷通華聲在這方面很早就進行了積極的探索,2011年,捷通華聲的靈云平臺就面向產業全面開放,并以“云 + 端”方式,為產業界提供語音合成(TTS)、語音識別(ASR)、麥克風陣列(SMA)、語音喚醒(VW)、手寫識別(HWR)、光學字符識別(OCR)、人臉識別(AFR)、聲紋識別(VPR)、指紋識別(FPR)、自然語言理解(NLU)、數據挖掘(DM)、機器翻譯(MT)等全方位人工智能能力。通過將其積累的人工智能技術開放出來,捷通華聲積累了眾多的合作伙伴,并服務大量的行業客戶。
融合多項智能應用,打通整個智能產業鏈條
武衛東指出,目前人工智能廠商大多提供單一的智能服務,比如語音識別、圖像識別等,多項智能應用的融合度不高。但是就市場需求來看,用戶想要的往往是多項智能服務,并且這些不同領域的智能應用要很好的融合,形成完善的解決方案。
捷通華聲作為在智能語音領域領先的廠商,其能力不僅局限于語音領域,已經擴展到智能圖像、智能語義、生物特征識別等領域。具體來看,捷通華聲提供的智能服務包括:
智能語音領域,捷通華聲能具備正確率為97%以上的語音識別能力,并能實現21種語言的語音合成服務,以及語義理解能力。另外,捷通華聲還提供獨具特色的聲紋識別應用,可以根據說話人的語音特征,提供聲紋鑒別和聲紋確認,并作為生物特征識別的重要手段;
智能圖像領域,捷通華聲提供的OCR服務,除了支持識別漢語、英語之外,還支持維語、蒙語、藏語、朝鮮語、哈薩克、彝族等多種少數民族語言的識別。更進一步的,捷通華聲具備手寫識別能力,能將手寫字跡轉化成文本,識別準確率在99.9%以上。此外,捷通華聲還支持人臉識別和指紋識別應用。
值得提出的是,捷通華聲通過靈云平臺來提供這些智能應用,致力于實現不同種類智能服務的融合,而不是簡單的產品堆砌。在武衛東看來,單項智能的局限性較大,未來必然是多項智能的高度融合。為此,捷通華聲突出全方位人工智能的能力建設,并以靈云平臺為載體,向開發者、合作伙伴開放出來,共同賦能整個智能生態的發展。
融合生物特征識別,提供個性化智能服務
構建人工智能平臺,不是單純的將各項AI能力放上去就可以,要發揮作用必然要理順內部的業務邏輯。在與武總的交流中,給我啟發比較大的是捷通華聲基于生物特征識別打通智能服務鏈條的構想和實踐。
在捷通華聲看來,人工智能應用的一個重要價值,就是對不同用戶提供高度符合其需求的相關服務。在以前,針對特定個體提供定制化服務只在很有限的范圍內實現,比如對VIP客戶的服務。現在,由于數據的積累和智能化技術的發展,基于數據分析的用戶畫像和定制化服務,無論從技術難度還是經濟效益上來說,都具備了實現的可能。而要實現對不同個體的定制化服務,關鍵的第一步就是對實現特定個體的識別。在互聯網時代,人們大多通過各類賬戶來實現用戶識別;在智能時代,基于生物特征的用戶識別將成為常態,比較典型的就是人臉識別和指紋識別。另外,捷通華聲還提供獨具特色的聲紋識別服務,可以根據一個人聲音特點來進行身份識別和驗證。
通過人臉、聲紋、指紋等生物特征識別技術,加上數據分析和用戶畫像,就可以打通整個智能服務鏈條,給用戶帶來實時、智能的服務體驗。為此,他描述了這樣一個場景:一個銀行用戶進入銀行,通過人臉識別、聲紋識別技術,系統可以根據對用戶面部和聲音的識別知道他的身份,再通過對系統內該用戶記錄和用戶畫像的分析,推測出該用戶的需求,并提供不同的服務。比如根據系統分析,如果一個用戶屬于風險厭惡型的,在推薦理財產品時就會選取低風險產品;如果分析出該用戶是激進型的,則推薦高風險、高收益的理財產品。這樣,可以大大提升用戶體驗,提升用戶粘性。這樣一套系統充分體現了人工智能相對于人的優越性,在上述場景中,銀行大堂經理是不可能對進入銀行的每個用戶都能全面了解的。通過人工智能與大數據技術,以及多項AI能力的融合,構建的這套系統能實現基于身份認證的個性化智能服務,這也是靈云平臺的優勢所在。
攜手合作伙伴,共鑄智能生態
作為成立于2000年并一直全面發展人工智能云服務的高新技術企業,捷通華聲不僅提供智能語音、智能圖像、生物特征識別、智能語義等全方位人工智能技術研究與應用,也與眾多伙伴一起,推展更豐富的應用領域,搭建互利共贏得智能生態。
基于靈云平臺,捷通華聲致力于用AI技術促進產品產業升級,鞏固合作伙伴行業地位,幫助合作伙伴落地AI業務場景,共同構建AI全鏈條的行業生態。為了最大化支持合作伙伴,捷通華聲可提供公有云、私有云服務及綜合智能解決方案,并針對不同產品靈活變換合作模式。此外還提供全套的技術培訓支持,包括靈云AI產品課程培訓、業務分享沙龍、在線視頻技術學習等,并在聯合推廣營銷方面給予合作伙伴大量的支持。
在人工智能的各個領域,平臺化、生態化趨勢日益明顯,其平臺和生態建設路徑一般是:通過AI技術賦能各個行業,找到一些適合AI應用的領域快速商業化和規模化;加快應用領域拓展、行業深耕和客戶資源的積累;搭建人工智能平臺,實現生態化發展。總體來看,捷通華聲也基本遵循了這一發展路徑,在發展出眾多AI能力之后,構建人工智能平臺,攜手合作伙伴共建智能生態,未來必將取得更大的成績。