作為本領域龍頭企業之一的神州泰岳,自10年前便開始在認知智能領域持續探索,長期積累下已取得了顯著成績。2018年6月30日,神州泰岳亮相2018中國國際軟件博覽會,正式上線全國首個智能語義開放平臺——中文信息(深度)處理開放創新平臺。
在此次軟博會人工智能高端論壇上,工信部及軟博會組委會選擇并推薦神州泰岳副總裁李國東發表主題演講,闡述神州泰岳多年來在語言智能領域的基礎技術研究、產品落地上的貢獻,同時展示了中文信息(深度)處理開放創新平臺在打破中文認知領域產業壁壘,加速產學研落地,構建并推動整體產業生態發展方面所作出的貢獻。
神州泰岳副總裁李國東
深度聚焦智能語義 實現產學研用育完整閉環生態
“人工智能的兩個重要部分:“感知”和“認知”。我國的漢語及少數民族語言構成了我們獨特的中文認知智能領域。我國早在1981年就由著名科學家錢偉長倡導,成立了中國中文信息學會,學會專注于中文認知智能、語言智能、語義智能領域的研究,集中了這一領域的所有專家學者。中文信息學會作為國家的一級學會甚至比人工智能學會還早。在認知智能領域的世界最高學會ACL,我國已經送出了兩任理事長,我國科學家李生還獲得了ACL的終身成就獎。在學術研究和基礎技術上我國在這一領域處于世界前列。
相對于轟轟烈烈的學術研究界,我國認知智能產業落地方面還處在成熟前期,尚沒有像感知智能一樣大發展,阻礙發展的主要障礙來自于:
第一,本領域技術門檻高,技術需要長期積累,一個算法一個技術改變不了整體。
第二,在認知智能產業,早年具有戰略眼光的公司不多,時至今日才感覺缺少長線布局。
第三,大量的技術成果基本都掌握在能夠長期潛心基礎研究的學校和研究機構當中。
第四,大量的技術成果尚沒有完成成果落地和商業轉移,長此以往將阻礙技術的進一步發展。” 中國中文信息學會秘書長孫樂與神州泰岳副總裁李國東在談到我國認知領域現狀時一致這樣認為。
認知智能的核心是自然語言理解,自然語言理解的核心技術就是語義理解,或者叫智能語義。在智能語義方面,神州泰岳至今已經進行了十多年的耕耘和技術積累,堪稱國內最早專注于認知智能領域的公司,同時由于公司長期業務的復雜和繁瑣性,神州泰岳在基礎技術以外更擅長于人工智能的應用和解決方案的落地,因此獲得了國際評估機構Gartner的積極關注和肯定。
正是由于神州泰岳的專注和堅持,2017年底,得到了我國認知智能領域的最高學會中國中文信息學會的認可,唯一指定了神州泰岳為學會產學研落地的合作伙伴,同時指導神州泰岳開發、建設了中文信息(深度)處理平臺。
據神州泰岳副總裁李國東介紹,中文信息(深度)處理平臺是依托于中國中文信息學會會員,專注于認識智能、語言智能,語義智能技術和產品及服務,平臺將囊括大部分專家學者的科研成果和產品,以及相關合作伙伴打造的產品的服務。
相比其他企業級AI平臺,中文信息(深度)處理平臺全面覆蓋了中文語言智能及其相關領域最前沿的技術成果和產品,同時圍繞認知智能打造開發工具、將技術PaaS化、SaaS化,構建并完成了產學研用育的完整閉環生態。中文信息(深度)處理平臺肩負著整體認知智能、語言智能行業的創新、孵化和落地任務,是真正的產業級平臺而不只是企業級平臺。
從該平臺產生的時間點看,認知智能正處于成熟前期,馬上要進入大發展;從平臺的特點看,跨產學研,跨企業的最全面覆蓋,是真正的天然產業生態平臺;從平臺的目的看,更加開放,加速技術創新,加速產品落地。以上幾點造就了平臺的唯一性和無法復制性。
圍繞認知智能領域,平臺形成了“一云、四塊、兩線”的總體發展戰略。
“一云”是基于現有公有云技術,附加開發工具和開發環境,構建完整的語言智能IaaS+PaaS+SaaS云生態。云端實現了平臺隨處可見、隨處可用。
“四塊”是建立在云平臺基礎上的四個核心業務板塊:開放板塊主要將本領域專家學者、合作伙伴、神州泰岳自身的技術以分為基礎服務、應用服務、解決方案的幾個維度,以多種形式在云端展示、開放,側重技術和產品隨處可看、可試、可用,降低技術和產品的匹配和尋找使用門檻;創新板塊則提供AI創新輔助工具集、產品管理、實施咨詢等工具類產品服務,側重解決技術的產品落地和技術持續創新問題;數據板塊則是針對大數據領域,為行業提供訓練數據集、評測數據集、大數據工具集等數據服務,打破由于數據不足而造成的通用技術難以在垂直行業落地的壁壘;培訓互動板塊會涉及實訓課程、智能問答中心、專家互動等多元培訓服務,培養人工智能技術人才,降低技術溝通門檻。“四塊”使整個平臺貫穿了從成果展示品牌建設、創新項目落地、數據共享產品孵化到技術推廣知識分享全環節。
“兩線”則從線上品牌孵化到線下成果轉化和落地推廣,充分發揮了創新云平臺的實用性與業務引領性。
平臺一期已匯聚合作院校20余所,專家團隊40余家,NLP服務120多個,覆蓋了本領域的主要技術,今后將全面覆蓋國內智能語義、中文語言智能及其相關領域最前沿和專業的技術成果和產品。該平臺的正式上線使神州泰岳在語義工具數量上位居同行首位,同時神州泰岳率先將在平臺上自身研發的基礎服務免費開放、推動生態發展。
李國東副總裁表示,中文信息(深度)處理平臺平臺將加速企業孵化轉型,是認知領域獨角獸平臺。未來,神州泰岳將繼續以實際行動堅守人工智能語義發展戰略。
為傳統行業全面賦能 著眼語義識別的全場景應用
任何一個新技術最重要的是如何對現實場景進行改造、達到自身技術落地,對于與現實結合緊密的語義智能領域更是如此。經過多年的實踐探索,神州泰岳的智能語義技術已經在公安、金融、政務、教育行業找到了眾多的落地場景,并開始為傳統行業全面賦能。
例如在智慧公安領域,認知智能、語義智能技術可以應用在刑偵、經偵、治安、情報、法制等非常具體的應用場景。通過整合案事件、現勘、筆錄、警情、人口、網絡數據等各警種來源的海量數據,并對數據進行交叉碰撞和智能分析, 從而更好地為公安局提供非結構化文本分析、數據分析服務、互聯網數據采集服務、互聯網數據分析與監測等服務,協助公安局完成公安業務數據的深度分析和挖掘等工作。
在金融領域,為了解決業務的規范表達與自然語言表達的復雜性及多樣性之間的矛盾,基于智能語義、認知智能技術,具備完全面向業務建模的能力,可讓研發人員專注于業務理解和業務表達,極大地縮短行業應用場景創新的研發周期,并提高應用質量。在銀行業,神州泰岳連續拿下“中、工、建”等多家客戶,并多次在于國際IT巨頭的競爭中脫穎而出。
在智慧政務領域,基于中文信息處理,可提供多元數據的的智能公文輔助寫作系統。同時結合知識圖譜的技術,可以實現對重大事件的預知、預告、預判,另外綜合管廊通信安防一體化解決方案,構筑起城市地下智慧神經系統。
智能語義領域想要取得更大發展除了自身的技術進步外,更重要的在于通過生態伙伴的廣泛合作,不斷積累技術和行業經驗。如今,神州泰岳在中國中文信息處理學會指導下,已平臺一期率先聚集了清華、北大、哈工大、北師大、蘇州大學、東北大學、中科院自動化所、軟件所等國內20多所自然語言處理核心研究機構的40余團隊,今后更將擴展到學研的全面覆蓋和企業的大面積覆蓋,將行業應用、數據、實施能力與先進技術配套結合,讓人工智能技術能真正具體的服務于企業、行業、社會,共同構建行業生態,充分釋放AI的生產力。
以此次軟博會和平臺一起上線為契機,神州泰岳將致力于全面打破認知智能的壁壘,利用產學研聯合進一步強化自身技術,通過打造產學研用育的閉環生態,為智能語義與其他行業的全面融合打下堅實基礎,并最終推動認知智能走向成熟。