廣義上的人工智能泛指通過計算機實現人的頭腦思維所產生的效果,通過研究和開發用于模擬、延伸和擴展人的智能的理論、方法、技術及應用系統所構建而成的,其構建過程中綜合了計算機科學、數學、生理學、哲學等內容。形象來說,人工智能可理解為由不同音符組成的音樂,而不同音符是由不同的樂器所奏響的,最終實現傳遞演奏者內心所想與頭腦所思的效果。本篇報告將從人工智能技術、應用、產業等維度進行探討,其中,人工智能技術包括凡是使用機器幫助、代替甚至部分超越人類實現認知、識別、分析、決策等功能,而產業則指包含技術、算法、應用等多方面的價值體系。
人工智能三起三落,60年登上圍棋之巔
20世紀50年代到70年代初,人們認為如果能賦予機器邏輯推理能力,機器就能具有智能,人工智能研究處于“推理期”。當人們意識到人類之所以能夠判斷、決策,除了推理能力外,還需要知識,人工智能在20世紀70年代進入了“知識期”,大量專家系統在此時誕生。隨著研究向前進展,專家發現人類知識無窮無盡,且有些知識本身難以總結后交給計算機,于是一些學者誕生了將知識學習能力賦予計算機本身的想法。發展到20世紀80年代,機器學習真正成為一個獨立的學科領域、相關技術層出不窮,深度學習模型以及AlphaGo增強學習的雛形-感知器-均在這個階段得以發明。隨后由于早期的系統效果的不理想,美國、英國相繼縮減經費支持,人工智能進入低谷。 80 年代初期,人工智能逐漸成為產業, 但又由于5代計算機的失敗再一次進入低谷。2010年后,相繼在語音識別、計算機視覺領域取得重大進展,圍繞語音、圖像等人工智能技術的創業大量涌現,從量變實現質變。
工業革命使手工業自動化,機器學習則使機器本身自動化
將樣本數據輸入計算機,一般算法會利用數據進行計算然后輸出結果,機器學習的算法則大為不同,輸入的是數據和想要的結果,輸出的則為算法模型,即把數據轉換成結果的算法模型。通過機器學習,計算機能夠自己生成模型,進而提供相應的判斷,達到某種人工智能的結果的實現。因此,在數據的“初始表示”(如圖像的“像素”)與解決任務所需的“合適表示”相距甚遠的時候,可嘗試使用深度學習的方法。工業革命使手工業自動化,而機器學習則使機器本身自動化。近幾年掀起人工智能熱潮的深度學習屬于機器學習的一個子集,在思想和理論上并未顯著超越二十世紀八十年代中后期神經網絡學習的研究,但得益于海量數據(603138)的出現、計算能力的提升,原來復雜度很高的算法得以落地使用,并在邊界清晰的領域獲得比過去更精細的結果,大大推動了機器學習在工業實踐中的應用。2018年2月,《麻省理工科技評論》揭曉2018年“全球十大突破性技術”榜單,GAN(對抗性神經網絡,一種特殊的深度學習算法)位列其中。
國家政策鼎力支持,人工智能道德與威脅問題仍需思考
伴隨政策支持的逐步深入,中國政府將有力推動新一代人工智能技術的產業化與集成應用,促進新一代人工智能產業發展,推動制造強國和網絡強國建設,助力實體經濟轉型升級,構筑我國人工智能發展的先發優勢。此外,相比美國和英國,中國對人工智能的支持力度雖更大,但較少關注人工智能的道德倫理問題、是否在開發對社會切實有益的人工智能以及應當最小化技術進步所帶來的威脅問題。
人工智能產業圖譜
人工智能典型技術剖析
語音識別、自然語言處理、語音合成等技術
人類因為具有語言的能力而區別于其他物種,自然語言處理即研究人與計算機直接以自然語言的方式進行有效溝通的各種理論和方法,涉及機器翻譯、閱讀理解、對話問答等,因為語言在詞法、句法、語義等不同層面的不確定性及數據資源的有限性、背景知識的復雜性等各方面限制,自然語言處理技術仍有非常大的提升空間,僅在特定領域可取得較好的應用,魯棒性存在大量挑戰。在自然語言處理之前,聲紋識別可根據說話人的聲紋特征識別出說話人,語音識別技術可賦予機器感知能力(在深度學習的驅動下,目前近場語音識別準確率可達98%,遠場、抗噪、多人等非限定或非配合條件下的識別有待進步),將聲音轉為文字供機器處理,在機器生成語言之后,語音合成技術可將語言轉化為聲音,形成完整的自然人機語音交互,這樣的語音交互系統可看作一個虛擬對話機器人,具體技術流程如下圖所示。
通用知識圖譜與行業知識圖譜
從覆蓋范圍的角度來說,知識圖譜可分為應用相對廣泛的通用知識圖譜和專屬于某個特定領域的行業知識圖譜。通用知識圖譜注重橫向廣度,強調融合更多的實體,主要應用于智能搜索、智能問答等領域。行業知識圖譜注重縱向深度,需要考慮到不同的業務場景與使用人員,通常需要依靠特定行業(如金融、公安、醫療、電商等)的數據來構建,實體的屬性與數據模式往往比較豐富。
視覺感知逐步實現商用價值,視覺認知仍有待探索
視覺使人類得以感知和理解周邊的世界,人的大腦皮層大約有70%的活動在處理視覺相關信息,計算機視覺即通過電子化的方式來感知和理解影像。得益于深度學習算法的成熟應用(2012年,采用深度學習架構的AlexNet模型,以超越第二名10個百分點的成績在ImageNet競賽中奪冠;2017年,ImageNet圖像分類競賽Top 5的錯誤率降至2.25%),側重于感知智能的圖像分類技術在工業界逐步實現商用價值,但與可結合常識做猜想和推理進而輔助識別的人類智能系統相比,現階段的視覺技術往往僅能利用影像表層信息,缺乏常識以及對事物功能、因果、動機等深層信息的認知把握。
多學科融合,幫助人類做出復雜決策
為了做出最優(經濟的或其他的)決策,決策相關理論將概率理論和效用理論結合起來,為在不確定情況下(在概率描述能適當呈現決策制定者所處環境的情況下)做出決策提供了一個形式化且完整的框架。因為理性決策的顯著復雜性,歷史上決策相關理論一直與人工智能研究沿著完全分離的路線向前發展,但自20世紀90年代以來,決策逐步深入人工智能系統研究,經濟學、博弈論、運籌學、人工智能等多領域學科思想融合,讓計算機智能處理海量數據,相對實時的解決人類專家也難以及時求解的各類問題。
自動駕駛系統剖析
根據自動駕駛的擬人化研發思路,自動駕駛系統原理可理解為感知——認知——決策——控制——執行五層,通過傳感器實現感知作用,并根據所感知信息完成處理與融合,對信息達成一定的認知和理解,在形成全局整體理解后,通過算法得出決策結果并傳遞給控制系統生成執行指令。在整個過程中,汽車能夠通過V2X(Vehicle to Everything)通信實現車與外界(如道路設施、其他車輛等)的信息交換,幫助車輛實時獲取更大范圍的環境信息,解決“我在哪兒,周圍有什么,環境將發生什么變化以及我該怎么做“等四個問題。
人工智能的應用場景
金融領域——主要應用場景及相關影像采集設備
與安防影像分析中人臉的“1:N”識別不同,目前泛金融領域以人臉“1:1”身份認證為主,部分場景涉及“1:N”識別,如銀行網點中對VIP客戶的智能識別。
公共安全領域——生物特征識別與大數據研判增加公安預測和決策能力
計算機視覺、語音識別、機器學習等多項智能技術可對人臉、指紋、虹膜、掌紋、指靜脈、聲紋、步態等多種生物特征進行身份識別,其中人臉、指紋、虹膜等三大生物特征共占全球生物識別市場份額的80%以上。在公安的實際業務場景中,人工智能技術還可對公安大數據進行智能分析,在構建“人、事、地、物、組織“的知識網絡的基礎上,實時監測預警、研判,切實增加公安的認知、預測和決策能力。伴隨人工智能及大數據的技術進步,高清聯網攝像頭、各種傳感器的硬件部署應用,從平安城市、智慧城市到雪亮工程等公共安全相關政策、人工智能相關國家戰略政策的逐步深化,公共安全領域的各種智能應用將由重點區域、有條件的地區起步,完成從局部到整體的全國性拓展。
教育領域——由表及里,逐步深入學習核心環節
人工智能已在老師教學與學生學習、評測的各個環節切入教育領域,相關產品服務包括拍照搜題、分層排課、口語測評、組卷閱卷、作文批改、作業布置等功能,涉及了自適應、語音識別、計算機視覺、知識圖譜、自然語言處理、機器翻譯、機器學習等多項人工智能技術,正在創造著更加個性化、服務于終身學習的智能高效學習環境。
泛信息處理領域——人工智能讓人與信息的連接日益高效便捷
搜索與輸入法作為人工智能在信息處理領域的典型應用,已大幅改變國人獲取信息與輸入信息的方式。移動互聯網時代,信息流推薦相關產品也成為用戶瀏覽應接不暇的信息的一種有效工具。在人機交互方式不斷升級的當下,人與信息接觸的種種環節都在發生著智能化的創新變革。
醫療健康領域——改善醫療資源分布不均的問題,助力專家學者攻克醫療難關
相對生命的復雜性,人類對醫療健康的理解仍非常粗淺,現階段人工智能技術也不能有效應對各種挑戰,但這并不妨礙我們對人工智能技術寄予厚望,試圖通過前沿技術改變醫療資源分布不均的現狀,將醫生從繁重的工作壓力中解放出來,并幫助他們減少誤診率,提高準確率,甚至探索出新的診療方案或找到新型有效藥物。
零售領域——人工智能賦能零售業,提升效率與收益,優化消費者體驗
通過數據與商業邏輯的深度結合、先進感知技術的成熟運用,人工智能、運籌優化等技術將切實提升零售全鏈條的資產配置效率,在精細化運營為企業創造出更多效益的同時,為消費者帶來更為理想的購物體驗。
廣告營銷領域——為廣告效果與營銷策略提供更科學的依據和更聰明的支持
相比人工智能在傳統行業的摸索嘗試,人工智能與廣告營銷的結合已有成熟落地(得益于數字營銷領域較好的信息化、網絡化基礎以及互聯網公司卓絕的技術創新力),用戶在搜索引擎、信息流產品、視頻網站、電視中看到的相關廣告可能都經過了人工智能算法對多維度大數據的智能分析。人工智能力圖為企業提供智能創意及營銷策略和效果監測,結合場景、內容及渠道向用戶精準推薦,實現滿足用戶真實需求的高價值信息傳遞。
交通出行領域——人工智能有效改善交通問題,智能化交通有望全自動化
人工智能算法對交通出行所產生的信息進行了分析與預判,人工智能技術的應用衍生出一系列智能設備,并對現有設備、應用和服務提供嵌入式的智能處理能力,以協助交通管理者更好地進行決策,以便車流最有效的方式通行,提高交通流效率,實現交通升級轉型——交通智能化;未來,智能化交通解決方法中,人工參與與處理將逐漸削弱,有望達到自動化運作的水平。
交通出行領域——共享出行攤低落地成本,自動駕駛引發產業融合
國內科技公司紛紛發聲將在2021年前后實現L4級自動駕駛(以國際汽車工程師協會制定(SAE)的自動駕駛級別劃分為衡量指標,L4級即系統完成所有操作,人類不一定需要對系統應答)乘用車的量產,但考慮到現有算法技術的能力邊界,艾瑞認為,2021年的時間節點相對樂觀,較難實現通用場景的L4級自動駕駛,小概率的意外缺陷都有可能引發致命事故。
但是,2021年成為創業者標桿的時候,它將促進“預言的自我實現”,技術的突破性進展及不斷拓寬的行駛場景依然值得期待。
實現自動駕駛需要在汽車中裝配大量的軟硬件設備,而大量設備將帶來高額推進成本。為減輕自動駕駛在推進消費市場時的成本等阻礙,可通過出行服務商進行系統安全性的評測并承擔相關成本。智能化與共享化是汽車產業生態的重要發展趨勢,車企、科技公司、出行服務商間的合作結盟也會愈發頻繁,智能出行公司隨之誕生。
智能客服領域——傳統客服由人力密集型向人機混合升級,提升咨詢效率
傳統客服業是典型的人力密集型,被視為是人工智能最有可能全面顛覆和取代的工種。不過,從目前的實踐情況來看,人工智能更多的是起到輔助人類決策和工作的層面,即,通過電話客服、網上客服、App、短信、微信以及智能機器人終端等產品與客戶進行語音或文本的互動交流,理解客戶淺層業務需求,回復客戶提出的業務咨詢,并根據客戶語音導航至指定業務模塊,實現優化人工客服咨詢效率。智能客服目前的成熟應用主要在售后階段,以重復性問題標準化回答為主,未來智能客服業的應用將繼續升級,由現在的“以問題為中心”轉變為“以用戶為中心”的智能語音助理,由現在服務于企業/商家的機器人轉變為服務于每一個用戶。
人工智能行業發展趨勢
對事物的完整行為規劃或事項決策的發展空間較大
以深度學習為基礎建立的人工智能技術一般是在用大數據解決小問題,而人類智能往往能夠以小數據解決大問題。人類可憑借自己的觀察和判斷形成最終的價值決策,機器的語音識別、計算機視覺等AI能力在現階段還很難支撐到對事物的理解、與判斷,距離完整行為規劃或事項決策仍有較大的發展空間。
未來不會出現崗位短缺,技術革命將提高社會整體福利
就失業問題而言,在向日益自動化的世界過渡時,機器學習和人工智能技術的發展升級定會逐步影響就業市場。我們假設人類的就業機會將大幅減少,然而,就業機會減少的同時,不得不承認的是,技術革命也會不斷促進萬眾創新,人們會從重復性的勞動中解放出來,將更多時間和精力用于創造性活動。換而言之,人工智能將緩解勞動力危機,使人們自由追求生活及工作新方式,從而提高社會的整體福利。因此,準確地說,在未來不會出現崗位短缺,取而代之的應當是匹配職業的技能的短缺。如同工業革命、信息革命等,歷史已經告訴我們,長久以來,新興科技帶來的問題都將被解決,從而使消費者們能夠享受與之而來的紅利。
人工智能將實現提效降本、延續人類智慧的核心價值
如同本文開篇所提,人工智能即通過智能實現人類思維的效果,從宏觀層面來看,此效果體現在智能社會與智能經濟層面, 即,人工智能將大幅改善依賴勞動力創造的勞動密集型、簡單重復性的傳統經濟運行模式,并依托此經濟模式構建萬物互聯、智能協同的產業體系,打造國際領先的智能社會。從微觀層面來看,人工智能將替代傳統勞動,帶來新式生產方式,以提升生產效率并降低成本,進而實現企業效益提升、改善人們工作與生活。而隨著機器變得聰明,我們將最終實現人性化人工智能(Humanistic AI),即通過機器達到擬人的形式并以這類形式延伸人類智慧。