為了方便廣大企業及個人開發者更好地享受到靈云全方位人工智能技術,近日,靈云SDK實現了版本全面升級,十多項人工智能技術全部對外開放,讓開發者真正能享受到全方位人工智能技術帶來的輕松與便捷。
登錄靈云開發者社區,開發者即可下載包括語音識別、語音合成、語音喚醒、語義理解、文字識別、人臉識別、手寫識別、機器翻譯、聲紋識別、鍵盤輸入在內的十多項人工智能技術SDK,支持Windows/Android/Linux/IOS等各種主流操作系統,能方便的集成到各種應用與客戶業務系統中。除此之外,在社區內還有麥克風陣列、靈云種子等聚合性SDK以方便開發者快速實現近遠場語音交互。
網址:https://www.aicloud.com/dev/index/index
語音合成SDK
作為國內最早從事語音技術研究與應用的企業,捷通華聲為廣大開發者提供的靈云語音合成SDK可將文本實時準確地轉換為自然、流暢的語音,并提供男聲、女聲、童聲等多種合成音色,支持中文普通話、粵語、維語、英語、日語等21種語言,并可為用戶提供定制化的語音合成服務。
語音合成SDK可以根據當前網絡狀況及指令的類型,自動判斷使用本地引擎還是云端引擎進行語音合成。此次版本的升級優化了優化TTS Player,提升云端訪問速度。
語音識別SDK
采用行業領先的深度學習算法,捷通華聲為開發者提供行業領先的語音識別SDK,普通話識別準確率高達96%,并采用實時識別方式,實時率可達0.3以下,已支持普通話、英語、粵語、維吾爾語、客家話等多種語言,具備很強的口音普適性,并可自由定制垂直領域的語音識別模型,識別效果更精確。
此次版本更新,SDK增加了本地語音意圖理解、云端本地雙路識別功能,優化ASR Recorder,提升云端訪問速度。
語音喚醒SDK
靈云語音喚醒SDK采用先進的芯片,ROM小于40K,低功率持續偵聽,用戶使用無感知,無需網絡,實時離線喚醒,喚醒率大于95%,且誤喚醒率低于小于 1次/24小時,并支持自定義設置多個喚醒詞,滿足用戶個性化需求。
語義理解SDK
為開發者提供的語義理解SDK可實現意圖理解與智能問答兩類核心功能,支持上下文語義分析、多輪對話、實體屬性等,支持天氣、導航、航班、音樂、閑聊等20多個常見領域,且支持HTTP、Socket、WebService以及MRCP等多種接口,滿足不同需求。
聲紋識別SDK
靈云聲紋識別技術采用端點檢測和噪聲消除技術,克服環境噪音對的影響,識別準確率高達99%,能夠在多人對話場景中分離出單個說話人音頻,并識別出每個人的說話內容,并提供聲紋自由說、動態數字、開放文本、固定文本密碼等多種識別模式。
人臉識別SDK
靈云人臉識別技術,采用最新深度學習算法,并引入國際領先的多模型融合技術,具備“一對一確認”與“多選一辨別”功能,可對人臉五官定位并對性別、表情、年齡、膚色、姿態等人臉屬性進行分析,提供人臉屬性識別、關鍵點定位、人臉1:1比對、人臉1:N識別、活體檢測等能力。
光學字符識別SDK
捷通華聲與清華大學合力攻關,應用最新機器學習算法,光學字符識別技術國際領先,識別率高達99.99%,讓機器不再只能識別“清晰、端正的文字”,還能識別“傾斜、相對模糊的文字”,并且支持更多的字體。支持文檔識別、票據識別、證照識別、銀行卡識別、名片識別等多種應用領域。
手寫識別SDK
靈云手寫識別技術采用最新深度學習算法,正楷、連筆字、無筆順識別率均在98%以上,且可支持中文、英文、維吾爾文、日文、韓文等多種語言、50多種筆勢識別,還擁有傾斜校正、簡繁體自動判斷、拼音獲取等強大功能,同時提供鋼筆、鉛筆、毛筆等多種筆形,將輸寫體驗融入藝術與傳統文化。
機器翻譯SDK
靈云機器翻譯技術采用國際先進的翻譯技術及深度學習算法,可生成流暢的譯文,翻譯結果地道流暢,忠實表達原文內容,滿足高質量的翻譯要求,該版本SDK支持中英、中維等多種語言互譯,具有翻譯準確率高、翻譯快速等優點。
鍵盤輸入SDK
靈云開放平臺為廣大開發者提供鍵盤輸入SDK,支持中文,外文,韓文,日文等識別,同時支持多種鍵盤(T9,Qwerty以及容錯鍵盤)以及多種輸入模式(拼音,五筆,筆畫等)。
全方位AI技術 助力智能場景應用落地
十多年的行業積累,捷通華聲靈云全方位人工智能技術已在各行各業得到廣泛應用實踐,靈云SDK在移動應用、智能客服、智能家電、智能音箱、智能車載、機器人等應用領域大顯神通:可為移動應用提供智能語音、圖像、手寫、生物特征識別等智能技術集成手段,可利用語音識別SDK、語音合成SDK、麥克風陣列SDK等讓電視、空調等實現自然遠場語言交互,可通過SDK結合打造可語音、手寫的智能車載輸入法,讓車載設備擁有遠場語音識別能力,可真正實現讓機器人“能說會聽、能寫會看、能辨音會認人、能思考會判斷”。
未來,捷通華聲將通過靈云全方位人工智能開放平臺,為廣大企業及個人開發者提供更多更加智能的人工智能能力SDK,助力企業智能化產品、設備的快速落地,從而實現“讓每個企業都擁有人工智能,讓每個人都能享受到人工智能的輕松與便捷”。