語音識別上,全球處于產業擴張階段,我國由產業培育階段步入擴張階段
報告指出,較高的技術成熟度促進全球產業規模持續增長,傳統語音企業和科技巨頭企業并存。語音識別的技術成熟度已達到95%的準確度,技術門檻較低吸引產業涌入大量企業以占位人工智能的感知流量入口,2017年全球新增語音識別企業增速突破20%,全球語音識別市場規模達到135億美元,2013年至2017年年均增速為21%。
傳統語音企業Nuance掌握著全球最多的語音技術專利占全球市場份額的31.6%,蘋果、谷歌、Facebook等科技巨頭企業陸續通過收購成熟的優勢技術初創企業,建立自主的語音識別引擎。基于此,全球語音識別產業正處于以市場應用為主導的擴張階段。
多樣化應用推動我國產業發展,行業已出現領航者。語音助手、語音輸入、語音搜索是我國語音識別行業的主要應用方式,隨著個人消費層面的社交娛樂需求持續增長,語音助手使用比例從2013年的30%左右快速攀升至2017年的80%以上,推動我國語音識別市場規模的增長,預計到2020年國內語音識別市場規模達到44.2億美元。
受益于長期垂直面向教育、電信、客服、政府等行業輸出語音合成和識別技術,科大訊飛通過行業級應用和服務的積累,目前占據我國語音識別市場接近50%的市場份額。語音識別對交互方式的變革,吸引國內科技巨頭和初創企業通過構筑獨立的技術鏈條,圍繞語音識別平臺、前端硬件等差異化的產品方向持續爭奪市場份額。
基于此,報告認為,我國語音識別產業正從技術應用發展為以市場應用為主導,從產業培育階段步入擴張階段。
自然語言處理:全球和我國均處于產業培育階段
報告稱,搜索引擎是自然語言技術成功應用的場景之一,圍繞搜索引擎延伸出來的推薦系統、廣告系統、機器翻譯等應用場景的持續擴展和探索,為全球自然語言處理產業提供巨大的市場空間。
報告顯示,2013年至2017年,自然語言處理市場增長至126億美元,年均增長率為18.4%。充分的發展空間持續使得自然語言處理在創業熱度、融資頻次和融資總金額都處于新一代人工智能產業的前三位,2017年全球新增自然語言處理企業104家,完成228起融資和并購事件,融資總金額高達24.6億美元,較之2016年翻三倍。
我國聚焦研發創新持續突破技術壁壘,圍繞垂直領域率先落地且初具規模。針對自然語言處理技術難度較大,應用場景相對復雜的現狀,我國重點關注行業的技術創新以提高產業的國際競爭力,中科大、中科院自動化所和聲學所組建國家重點實驗室不斷儲備研究成果。
截至2017年,我國擁有自然語言處理的申請專利突破4000個,占全球該領域專利申請數的48%。智能家居、智能車載、智能客服、智能駕駛、虛擬助理等垂直領域得益于應用場景較為單一,產品和解決方案率先落地,2017年獲得融資總金額21億美元,占全球當年產業融資金額的85%。
基于此,報告認為,我國自然語言處理產業正處于以技術應用為主導的培育階段。
計算機視覺:全球和我國均處于產業擴張階段
報告稱,全球市場經過爆發后進入穩定增長期,持續聚焦底層技術研發構建開源生態。美歐日等發達國家的計算機視覺產業發展較為早期,技術的快速迭代推動產業在2007年至2014年進入了爆發式增長,年均增長率為18%。隨著主要應用領域工業檢測與測量逐漸趨于飽和,新的應用場景尚在探索,全球市場進入穩定增長期,2017年全球計算機視覺市場規模達到46億美元,2015年至2017年均增長率穩定至8.2%。
為快速拓展巨大的消費級應用市場,蘋果、亞馬遜、谷歌等科技巨頭持續收購成熟的技術團隊完善技術體系,并陸續推出開源計算機視覺開發平臺,吸引初創企業協作開發面向不同場景的解決方案,共同推動產業的發展。
報告稱,人臉識別引爆了我國市場增長,圍繞企業級提供服務的競爭已趨于同質化。人臉識別在我國計算機視覺領域起步最早,主要用于對風控要求高的金融、安防、交通等行業,推動我國計算機視覺市場規模2017年市場規模達4.2億美元,占全球8.3%,增速達22.2%,位居全球首位。
以人臉識別技術為核心的商湯科技在2017年獲得4.1億美元的B輪融資,創造了全球新一代人工智能領域單輪融資最高紀錄。市場的爆發和資本的助推吸引我國初創企業紛紛涌入,2017年我國新增計算機視覺企業達到79家,占據全球新增企業的52%。初創企業圍繞人臉識別、圖像識別面向企業提供軟硬件一體化解決方案,產品和業務模式較為同質化。
基于此,報告認為,我國計算機視覺產業正處于以市場應用為主導的擴張階段。