人工智能(AI)作為數字時代的轉型技術脫穎而出——人工智能在整個經濟中的實際應用正在快速增長。為了撰寫《人工智能前沿記:數百用例知道多》這一簡報,我們將傳統分析和更新的“深度學習”技術及其可以解決的問題映射到公司和組織的400多個特定用例中。借助麥肯錫全球研究院的研究以及麥肯錫分析人工智能的應用經驗,我們評估了跨行業和業務職能的高級人工智能技術的實際應用和經濟潛力。我們的研究結果強調了在整個經濟中應用深度學習技術的巨大潛力,但隨著技術的不斷發展,我們也意識到一些揮之不去的局限和障礙(以及未來的機遇)。最終,人工智能的價值不在于模型本身,而在于公司是否有能力使用人工智能。
即使我們意識到使用人工智能技術的經濟潛力,數據的使用也必須始終考慮到數據安全性、隱私和潛在的偏見等等的問題,這一點不得不強調。
將人工智能技術對應到問題類型
隨著人工智能技術的發展,到底是哪種技術構成了人工智能的定義也在不斷發展。出于本簡報的目的,我們將使用人工神經網絡的深度學習技術的簡稱為人工智能。我們還考察了其它機器學習技術和傳統分析技術。
神經網絡(neural network)是機器學習技術的一部分。神經網絡本質上是基于通過模擬方式連接的“神經元單元(neural unit)”的人工智能系統,這些系統粗略地模擬了神經元在大腦中的相互作用方式。自20世紀40年代以來,人們已經研究了受神經連接啟發的計算模型,并且隨著計算機處理能力的提高和大型訓練數據集成功地用于分析輸入數據(如圖像、視頻和語音)而再次聲名大噪。人工智能從業者將這些技術稱為“深度學習”,因為神經網絡具有很多(“深”)層的模擬互連神經元(simulated interconnected neuron)。
我們分析了三種神經網絡技術的應用和價值:
• 前饋神經網絡(feed forward neural network):最簡單的人工神經網絡。在這種架構中,信息僅在一個方向上移動,從輸入層向前移動,經過“隱藏”層移動到輸出層。網絡中沒有環路(loop)。首個單神經元網絡是由人工智能先驅Frank Rosenblatt在1958年提出的。雖然這個想法并不新鮮,但計算能力、訓練算法和可用數據的發展促成了高于以往的性能水平。
• 遞歸神經網絡(Recurrent neural network,RNN):人工神經網絡的神經元之間的連接包含環路,這些環路非常適用于處理一連串輸入。2016年11月,牛津大學的研究人員報告說,基于遞歸神經網絡(和卷積神經網絡)的系統在唇讀(reading lips)方面達到了95%的準確率,優于經驗豐富的人類唇讀者,后者的準確率為52%。
• 人工神經網絡,其中神經層之間的連接受到動物視覺皮層(animal visual cortex)的啟發,動物視覺皮層是大腦處理圖像的部分,非常適用于感知方面的任務。
對于我們的用例,我們還考慮了另外兩種技術——生成對抗網絡(GAN)和強化學習——但未將它們包含在我們對人工智能的潛在價值評估中,因為生成對抗網絡這一新生技術尚未得到廣泛應用。
生成對抗網絡(GAN)使用兩個神經網絡在零和游戲(zero-sum game)框架中相互競爭(因此是“對抗”)。生成對抗網絡能學會模擬各種數據分布(例如文本、語音和圖像),因此,一旦沒有數據分布可用的話,該網絡就能生成測試數據集,這很有用。
強化學習是機器學習的子領域,在強化學習中,系統通過接收虛擬“獎勵”或“懲罰”來得到訓練,這實際上是通過試錯法來學習。谷歌DeepMind已經使用強化學習來開發可以玩游戲的系統(包括視頻游戲和圍棋(Go)等棋類游戲),其能力勝過人類冠軍棋手。
在業務環境中,這些分析技術可用來解決現實問題。最普遍的問題類型是分類、連續評估(continuous estimation)和聚類(clustering)。側欄中提供了問題類型及其定義的列表。
用例帶來的洞察
我們整理并分析了19個行業和9個業務職能部門的400多個用例。這些用例為特定部門里的領域帶來了這樣的洞察——深度神經網絡在這些領域里所能創造的最大價值,這些神經網絡相較于傳統分析所能產生的增量提升,以及為了實現潛力而必須得到滿足的貪婪的數據需求(就數量,種類和速度而論)。我們的用例庫雖然范圍很廣,但并不詳盡,可能會夸大或低估某些部門的潛力。我們將繼續對它進行改進和擴充。
人工智能可用于改善現有用例性能的例子包括:
• 預測性維護(predictive maintenance):機器學習檢測異常的能力。深度學習能分析大量高維數據(high dimensional data),因此它可以將現有的預防性維護系統(preventive maintenance system)提升到一個新的水平。如果將額外的數據(例如來自其它傳感器的音頻和圖像數據,來自麥克風和攝像機等相對便宜的傳感器也算)加入分層中,神經網絡就可以增強并取代更傳統的方法。人工智能能夠預測故障并使有計劃的干預措施成為可能,這些能力可以減少停機時間和運營成本,同時提高生產力。例如,人工智能可以用傳統的分析技術延長貨機的壽命,使其壽命大大超出預期,方法就是將飛機模型數據、維護記錄、物聯網傳感器數據(例如發動機振動數據的異常檢測)和表明發動機狀況的圖像和視頻通通結合起來。
• 人工智能驅動的物流優化可以通過實時預測和行為指導來降低成本。物流中使用人工智能技術(如連續評估)可以為各個部門帶來實實在在的增值。人工智能可以優化運輸路線,從而提高燃油效率并縮短交付時間。有一家歐洲貨運公司將燃油成本降低了15%,其方法五花八門,比如使用能同時監控車輛性能和駕駛員行為的傳感器,讓司機接收實時指導(包括何時加速或減速)、優化油耗并降低維護成本。
• 人工智能可以成為解決客服管理和個性化服務方面的難題的有用工具。因為人工智能技術的應用,呼叫中心管理和呼叫路由(call routing)中的語音識別得到了改善,為客戶提供了更加無縫的體驗(和更高效的處理能力)。這些功能不僅僅停留在文字上。例如,對音頻進行深度學習分析使系統能評估客戶的情緒;如果客戶對系統反應不佳,呼叫會自動再路由到接線員和管理員。人工智能技術在營銷和銷售的其它領域也能產生重大影響。將客戶人口統計、過去的交易數據與社交媒體監控相結合有助于生成個性化的產品推薦。面向個人客戶的“下一個要購買的產品(next product to buy)”推薦(亞馬遜和網飛等公司已成功實施)可以使銷售轉化率提高兩倍。
人工智能的使用場合中,有三分之二用于提高現有分析用例的性能
在我們研究的69%的用例中,深度神經網絡可用于提高性能,其提升性能的能力優于其它分析技術。我們將不得不使用神經網絡的情況姑且稱為“綠地(greenfield)”案例,這種情況僅占總數的16%。對于剩下的15%,人工神經網絡在性能上略勝于其它分析技術,原因之一是數據的局限導致這些案例不適用于深度學習。
綠地人工智能解決方案(Greenfield AI solution)在客戶服務管理等業務領域以及數據豐富且數量龐大并且有時會整合人類反應的一些行業中非常普遍。在各大行業中,我們發現醫療領域里綠地用例尤其多。這其中有一些用例涉及疾病診斷和護理改善,這些用例還依賴于包含圖像和視頻輸入的富數據集(MRI發來的圖像和富數據集也算)。
平均來看,我們的用例表明,現代深度學習人工智能技術對附加值的提升可能遠高于傳統分析技術,高出30%到128%不等,具體要看行業。
然而,在我們掌握的大量用例中,由于人工智能在某些情況下潛力有限,所以傳統分析和機器學習技術繼續支撐著行業(包括保險、制藥和醫療產品以及電信)中很大一部分的價值創造潛力,人工智能則局限于某些環境中。在某種程度上,這歸咎于這些行業使用數據的方式,歸咎于監管問題。
深度學習的數據需求遠遠高于其它分析
要在大多數應用中高效使用神經網絡就需要大型的經過標記的訓練數據集,同時充分使用計算基礎設施。此外,這些深度學習技術特別強大,能從復雜的多維數據類型(如圖像,視頻,音頻或語音)中提取模式。
深度學習方法需要成千上萬的數據記錄才能使模型在分類任務中表現得相對較好,在某些情況下,該方法要數百萬的數據記錄才可以達到人類的表現水平。根據一個估計,有監督深度學習算法(supervised deep-learning algorithm)往往能達到可接受的性能(每個類別有大約5,000個標記示例),并且當人們用包含至少1,000萬個標記示例的數據來訓練有監督深度學習算法時,該算法能達到或超越人類的表現水平。在目前使用高級分析的某些情況下,可用的數據非常多(每個數據集有數百萬甚至數十億行),以至于人工智能非用不可。但是,如果數據量閾值未達到,人工智能可能無法為傳統的分析技術增值。
對于很多業務用例而言,這些海量數據集很難獲取或創建,并且標記仍是一個難題。當前大多數人工智能模型都是通過“有監督學習”進行訓練的,有監督學習要求人類對基礎數據進行標記和分類。然而,有前景的新技術將克服這些數據瓶頸(例如強化學習,生成對抗網絡,轉移學習和“一次性學習”),使訓練有素的人工智能模型可以根據少量(有時只有一個)真實的演示或示例來學習主題。
組織必須采用和實施能大規模收集和整合數據的戰略。即使組織有大型數據集,它們也必須防止“過擬合(overfitting)”,即模型與訓練集的“嘈雜的”特征或隨機特征過于匹配,過擬合會導致未來性能缺乏相對的準確性,它們還要防止“欠擬合(underfitting)”,即模型無法捕獲所有相關功能。將客戶群和渠道之間的數據連接起來,而不是讓數據在孤島中衰敗,這對于創造價值尤為重要。
人工智能要實現全部潛力就需要各種數據類型(包括圖像、視頻和音頻)
神經人工智能技術(Neural AI technique)擅于分析圖像、視頻和音頻數據類型,因為它們具有從業者稱為“高維度”的復雜的多維性質。神經網絡擅長處理高維度,因為網絡中的多個層可以學會表述數據中存在的很多不同特征。因此,對于人臉識別來說,網絡中的第一層可以關注原始像素,下一層則關注邊緣和線條,再下一層則關注通用面部特征,而最后一層則可以識別人臉。這些神經網絡技術不同于前幾代人工智能(前幾代人工智能往往需要人的專業知識來做“特征工程”),它們往往能夠學會在模擬神經網絡中表述這些特征,成為訓練過程的一部分。
除了和數據量和數據有關的各種問題,速度也是一個需求:人工智能技術需要重新訓練模型,以匹配可能的條件變化,因此訓練數據必須經常刷新。在三分之一的案例中,模型至少每月更新一次,幾乎四分之一的案例需要每天更新;在營銷和銷售以及供應鏈管理和制造方面尤其如此。
確定人工智能潛在價值的大小
我們估計,我們在本次簡報中引用的人工智能技術有可能在19個行業的9個業務職能中每年創造3.5萬億至5.8萬億美元的價值。這構成了每年總體影響力(即9.5萬億到15.5萬億)約40%的比重,這個比重也許可以由所有的分析技術實現。
按行業來看,我們估計人工智能的潛在價值相當于2016年收入的1%至9%。按行業收入百分比衡量的價值在不同行業之間大不相同,這取決于具體的適用用例、大量的復雜的數據的可用性,以及監管和其它限制因素。
這些數字不是某個特定時期的預測,但它們表明了高級分析所代表的全球經濟的巨大潛力。
從我們研究過的用例中,我們發現使用人工智能產生的最大潛在價值影響都包含在以銷售收入為導向的功能中,例如營銷和銷售,也包含在以損益表底線為導向的運營功能,包括供應鏈管理和制造業。
零售和高科技等消費行業往往在營銷和銷售人工智能方面的應用程序中更有潛力,因為業務和客戶之間的頻繁數字互動會產生更大的數據集,以便用上人工智能技術。特別是電子商務平臺將受益。這是因為這些平臺可以輕而易舉地收集客戶信息(例如點擊率數據或客戶在網頁上花費的時間),然后能動態、實時地為每個客戶定制促銷、價格和產品。
以下是我們看到的受到人工智能影響的三個部門的簡介:
• 在零售業,營銷和銷售是人工智能能發揮最大潛在價值的領域,在該職能范圍內,定價和促銷以及客戶服務管理是主要的價值領域。我們的用例表明,使用客戶數據將促銷活動個性化(例如,包括每天定制個別優惠)就可以使實體零售商的增量銷售額增加1%到2%。
• 在消費品中,供應鏈管理是可以從人工智能部署中受益的關鍵功能。在我們所列舉的用例中,我們發現基于需求的潛在因果驅動因素(而不是先前的結果)的預測如何能夠將預測準確性提高10%到20%,這意味著庫存成本可能會降低5%,收入可能會增加2%到3%。
• 在銀行業,尤其是零售銀行業(retail banking),人工智能在營銷和銷售方面具有巨大的價值潛力,絲毫不亞于它在零售業的價值潛力。然而,由于評估和管理銀行業風險的重要性(例如貸款承保和欺詐檢測),人工智能在提高銀行業風險績效方面所具有的價值潛力要高于很多其它行業。
通往產生影響力和價值的道路
人工智能正在吸引越來越多的企業投資,隨著技術的發展,可發掘的潛在價值很可能會增長。然而,到目前為止,只有約20%意識到人工智能重要性的公司目前在核心業務流程中使用其中一項或多項技術,或大規模使用這些技術。
盡管人工智能技術前景廣闊,它仍有很多需要克服的局限。這些局限包括上面列出的苛刻的數據需求,還包括一下五個局限:
• 第一個局限是標記訓練數據的挑戰,這些數據往往必須手動完成,它們對于監督學習是必要的。有前景的新技術正在不斷涌現,旨在應對這一挑戰,例如強化學習和流內監督(in-stream supervision),在這些技術里,數據可以在自然使用過程中進行標記。
• 第二個局限是難以獲得足夠大且全面的數據集用于培訓;對于很多商業用例來說,創建或獲取此類海量數據集可能很困難——例如,有限的臨床試驗數據可以更準確地預測醫療治療結果。
• 第三個局限是難以用人類的話來解釋大型復雜模型得出來的結果:為什么達成了某個決定?例如,醫療以及汽車和航空航天工業中的產品認證可能是一個障礙;除了其它限制因素外,監管機構往往希望規則和選擇標準能夠得到清楚的解釋。
• 第四個局限是學習的普遍性:人工智能模型從一種情況轉移到另一種情況時仍然存在困難。這意味著公司必須投入資源來訓練新模型,即使是與之前類似的用例。遷移學習(人工智能模型在這里得到訓練以完成某項任務,然后快速將學到的知識應用于類似但不同的活動)是對這一挑戰的一個有前景的回應。
• 第五個局限涉及數據和算法偏差的風險。這個問題本質上涉及更具社交意義的憂慮,并且可能需要更廣泛的步驟來解決,例如,要了解用來收集訓練數據的流程以什么樣的方式影響曾經受過它們訓練的模型的行為。例如,當訓練數據不代表應用人工智能模型的較大人口時,人們可能會引入非預期的偏差。因此,當人們將人臉識別應用到具有更多不同特征的群體時,在與人工智能開發者的人口統計相對應的面部群體上受到訓練的人臉識別模型可能會遇到困難。最近關于惡意使用人工智能的報告突出了一系列安全威脅,如復雜的入侵自動化、超個性化的虛假政治宣傳活動等等。
組織面臨的與技術、流程、人員有關的難題可能會減緩或阻礙人工智能的采用
計劃采用重要深度學習工作的組織要考慮一系列有關如何做到這一點的選擇。選擇范圍包括構建完整的內部人工智能功能,將這些功能外包或利用人工智能即服務(AI-as-a-service)產品。
公司要根據計劃要構建的用例來制定一個能產生結果和預測的數據計劃,這些數據計劃可以輸入設計的界面,供人類在交易系統上進行操作。關鍵的數據工程難題包括數據創建或數據獲取,定義數據本體(data ontology)以及構建適當的數據“管道”。鑒于深度學習的重要計算要求,因為法規或安全問題,有些組織將維護自己的數據中心,但資本支出可能相當大(特別是在使用專用硬件時)。云供應商提供另一種選擇。
如果組織在數字化方面不成熟,流程也可能會成為成功采用的障礙。在技術方面,組織必須開發強大的數據維護和治理流程,并實施現代軟件規程,如敏捷(Agile)和開發運維(DevOps)。在規模方面,更難的是克服“最后一英里”問題,即確保人工智能提供的卓越洞察在企業人員和流程的行為中得到實例化。
從人的陣線來說,深度神經網絡的大部分建設和優化仍然是一種藝術,因此需要真正的專家才能提供逐步改進的性能。這些技能供不應求;根據一些估算,具備解決嚴重人工智能問題所需的技能的人不到10,000個。科技巨頭們紛紛展開激烈的人才爭奪戰。
人工智能似乎是一個難以捉摸的業務用例
在人工智能技術和數據可用且價值得到明確驗證的情況下,組織就可以抓住機遇。在某些領域,當今的技術可能已經成熟并且數據已經可用,但考慮到人工智能可能生成的價值,部署人工智能的成本和復雜性可能根本不值得。例如,航空公司可以使用人臉識別和其它生物識別掃描技術來簡化登機流程,但這么做所帶來的價值可能無法證明與隱私和個人身份有關的成本和問題的合理性。
同樣,我們看到了很多潛在案例,在這些案例中,數據和技術日趨成熟,但價值尚不明朗。最不可預測的情況是,數據(類型和數量)或技術都太新,且未經檢驗,以至于無法知道數據到底能發掘多少價值。例如,在醫療方面,如果人工智能能在驚人的精細度上再接再厲(我們要做X光分析才能看得到),將這種精度拓寬到醫療診斷乃至醫療程序上,這種經濟價值是不可估量的。與此同時,抵達這一前沿的復雜性和成本也令人生畏。除其他問題外,這還需要完美的技術執行和解決醫療事故保險和其他法律問題。
社會問題和法規也可能限制人工智能的使用。監管限制在與個人身份信息相關的使用案例中尤為普遍。在一些關于某些在線平臺上個人數據的使用和商業化的公眾辯論日益激烈的時期,這一點尤為重要。個人信息的使用和存儲在銀行、醫療、醫藥和醫療產品以及公共和社會部門等部門尤為敏感。除了解決這些問題之外,企業和其它人工智能數據用戶還要繼續發展與數據使用相關的業務模式,以解決社會關注的問題。此外,監管要求和限制因國家和部門而異。
對利益相關者的影響
正如我們所看到的,真正創造價值的是公司對人工智能模型的執行能力,而不是模型本身。在最后這一節,我們概述了研究人工智能技術提供者、人工智能技術的應用者和政策制定者的案例所隱含的一些高層次的影響,這些人兩種情況都占了。
• 對于提供人工智能技術的公司來說:很多為其它公司開發或提供人工智能的公司在技術本身和數據科學家所需的數據方面具有相當大的優勢,但這些公司可能缺乏對終端市場的深刻理解。了解人工智能跨部門和職能的價值潛力有助于塑造這些人工智能技術公司的投資組合。也就是說,它們不一定只是優先考慮潛在價值最高的領域。相反,它們可以將所有的資源(對競爭格局的互補分析、對自身現有優勢的互補分析、部門或職能領域的知識和客戶關系)結合起來,以打造投資組合。在技術方面,將問題類型和技術對應到具有潛在價值的部門和職能對具有特定專業領域的公司所要關注的重點具有指導作用。
• 很多設法在運營中采用人工智能的公司已開始在業務中進行機器學習和人工智能實驗。在推出更多試點項目或測試解決方案之前,走出藩籬并采取整體方法來解決問題,進而在整個企業中確立一系列重要的計劃(包括人工智能和更廣泛的分析和數字技術),這是十分有用的。要讓業務負責人確立適當的投資組合,重要的是要了解哪些用例和領域有望為公司帶來最大價值,以及需要對哪些人工智能和其它分析技術進行部署,獲取這個價值。這個投資組合必須得到兩方面的啟迪,即在哪里能踐行理論價值以及如何在整個企業范圍內大規模部署技術。分析技術如何擴展的問題不僅取決于技術本身,更取決于公司的技能、能力和數據。公司要考慮“最初一英里”(和“最后一英里”)方面的工作,即如何獲取和組織數據和工作,或者如何將人工智能模型的輸出整合到工作流程中(從臨床試驗經理和銷售隊伍管理者乃至采購人員)。麥肯錫全球研究院以往的研究表明,人工智能領導者在最初一英里和最后一英里的這些工作中投入了大量資金。
• 政策制定者要在支持人工智能技術的發展和管理不良行為者的風險之間取得平衡。他們有意支持廣泛采用,因為人工智能可以帶來更高的勞動生產率、經濟增長和社會繁榮。他們的手段包括對研發的公共投資以及對各種培訓計劃的支持,這些手段有助于培養人才。在數據問題上,政府可以通過開放的數據計劃直接刺激訓練數據的開發。開放公共部門數據可以刺激私營部門的創新。設立通用數據標準也大有裨益。人工智能也給政策制定者提出了新的問題,即傳統的工具和框架可能不夠用的問題。因此,人們可能需要一些政策創新來應對這些快速發展的技術。但鑒于商業、經濟和社會受到了巨大的積極影響,其目標不應該只限制人工智能的采用和應用,而是鼓勵人工智能得到有益和安全的使用。