18個月前,Cooper公司為其客戶服務代理商推出了智能推薦系統,以便為客戶問題提供解決方案。該公司前身為Nationstar公司,是美國最大的非銀行抵押貸款提供商,擁有380萬客戶,因此該項目被視為該公司一個令人關注的節省成本的項目。該公司首席信息官Sridhar Sharma說,該公司花費九個月的時間才發現代理商沒有使用它,又花了六個月的時間來弄清楚原因。
Sharma發現,智能推薦系統提供的建議與客戶并不相關,但問題不在于機器學習算法。相反,該公司依賴于基于客戶問題的技術術語描述訓練數據,而不是使用客戶自己的語言描述這些問題。
他說:“我們沒有很好地確保客戶提出問題的根源是沒有采用客戶使用的術語,這是因為是用我們內部使用的技術術語編寫的。”
Sharma說,此外,智能推薦系統的反饋機制(代理記錄通話結果)有重疊的類別,這使得問題更加嚴重。他拒絕透露這個項目給該公司造成了多大的損失。
Cooper公司陷入人工智能的困境并不是異常現象。根據調研機構IDC公司最近的一項調查,只有約30%的受訪者表示其人工智能項目的成功率為90%,大多數受訪者表示其失敗率為10%到49%,而3%的受訪者表示一半以上的人工智能項目已經失敗。
超過四分之一的受訪者認為,缺乏員工以及人工智能技術具有不切實際的期望是面臨的主要挑戰。另有23%的人表示他們的人工智能項目因為缺乏必要的數據而失敗。
Sharma說:“失敗的第一個征兆是有些人想退出這個項目。但如果這樣做,就注定要失敗。”
Cooper公司計劃明年將重新回到客戶服務項目,作為其客戶關系管理(CRM)系統改革的一部分,企業將繼續致力于人工智能技術的開發。其最新的機器學習項目涉及分析非結構化數據,已經具有積極的商業利益,并有助于為未來創建更好的語言訓練數據。
他補充說,“這些措施的成本并不低,當事情不順利時,需要企業首席執行官和首席財務官的支持。”
缺乏數據
數據問題是人工智能項目達不到預期目標的主要原因。根據麥肯錫公司去年秋天發布的一份調查報告,限制人工智能技術應用的兩大挑戰與數據有關。
首先,與Cooper公司一樣,許多公司很難獲得適當標記的數據來訓練他們的機器學習算法。如果數據沒有正確分類,工作人員必須花費大量時間標記,這可能會延遲項目或導致項目失敗。第二個數據問題是沒有項目的正確數據。
普華永道公司合伙人兼全球人工智能領導人Anand Rao表示,“企業通常沒有合適的數據,如果無法使用未標注的數據建立模型,就會感到沮喪。這就是企業實施人工智能項目一直失敗的地方。”
美國奧杜邦協會正在使用人工智能來幫助保護野生鳥類。例如,該組織在7月份發布了一項關于氣候變化如何影響38種草原鳥類的人工智能分析結果。
奧杜邦協會保護科學副總裁Chad Wilsey說,“如果我們不采取任何措施來減緩氣候變化的速度,那么42%的草原鳥類可能面臨滅絕,但如果我們能夠采取行動,那么可以將其比例降低到8%。”
并非所有奧杜邦協會的人工智能項目都取得了成功。去年夏天,該組織試圖利用機器學習來計算海灘上的褐鵜鶘和剪嘴鷗的數量。該試點項目基于一組志愿者收集的圖像,這些志愿者通過無人機在德克薩斯州海岸附近的一個島上進行調查。
Wilsey說,“我們有興趣了解通過的颶風如何影響鳥類種群。”
例如,大多數可用的鳥類圖片都是由地面上的工作人員拍攝的,而不是無人機直接拍攝。Wilsey說,由于這是一項試點研究,奧杜邦協會沒有資源拍攝更多的照片。
訓練數據偏差
另一個人工智能項目因缺乏數據而受阻的例子是弗里茨實驗室試圖創建一個模型來識別照片中人們的頭發。弗里茨實驗室幫助移動開發者構建可以直接在手機上運行的人工智能模型,而無需將數據發送回中央服務器進行處理。
該公司首席技術官Jameson Toole說,“我們希望建立一個能夠在實時視頻中檢測頭發并實時改變顏色的功能。”
他說,起初一切看起來都很好,但算法中存在一個重大缺陷,如果系統公開上市的話,其問題會非常嚴重。
Toole說,“值得慶幸的是,我們在辦公室和我們招募的人員之間進行了大量的人工測試,我們意識到對于某些種族人群來說,這并不是一件好事,我們重新篩選了數據集,以確定數據集中沒有人是這些種族人群的一部分。”
他說,有很多圖像數據集可供訓練,包括免費的和商業的數據集。但是企業必須檢查是否有他們需要的特定類型的足夠數據。
他說:“企業首先要花費一定的時間,努力構建自己的代表用戶群的測試用例。”
弗里茨實驗室最終收集了丟失的圖像,并通過工作人員的處理對它們進行注釋。Toole說,“這無疑凸顯了這樣一個事實,即當受到可用數據的限制時,將偏見引入這樣的系統并不困難。”
根據普華永道公司最近的一項調查,一半以上的公司沒有評估人工智能偏見的正式流程。更糟糕的是,只有25%的受訪者表示他們會在實施之前優先考慮人工智能解決方案的道德含義。
數據集成問題
有時,問題不在于缺乏數據,而在于數據太多。普華永道公司零售業務方面的人工智能和數據的常務董事表示,一家全球性大型銀行就面臨這種情況。
他表示,如果能夠回到過去,這家銀行就會更早地開始將不同的數據渠道匯集在一起??。他說,“這是我們沒有做的事情,這是一個很大的錯誤。我們收集了數據,其結果是我們沒有獲得完全的全方位的客戶視圖。”
他補充說,該數據整合??問題損害了這家銀行創建有效營銷信息的能力,導致收入損失,該銀行現在正轉向多渠道客戶數據視圖,包括在線、移動和面對面互動。
他說,“我們仍然不在那里,孤立的數據是我們擁有并仍然存在的最大挑戰之一。這個挑戰不是技術問題,而是商業問題,第一個問題是合規性。我們不允許混合某些類型的數據。”
他說,“另一個問題與企業優先事項有關。還有很多其他項目正在運行。誰會為將數據混雜一起而支付費用?這本身并不是銀行的增值業務。”他表示,這是每個銀行都必須面對的挑戰。
他說,“如果再次開展這個項目,應該在銀行首次開始處理人工智能用例時啟動數據集成過程。我不認為我們真的會做到這一點,因為有太多的數據來源,我不認為都能完全完成。”
他表示,該銀行預計在未來18至24個月內將連接其主要數據源。他說,現在該銀行只有10%到15%左右。
數據漂移
人工智能項目面臨的另一個問題是企業依賴歷史數據而不是活動交易數據來進行訓練。埃森哲公司董事總經理安德里Andreas Braun表示,在許多情況下,在轉換為實時數據時,對單個靜態歷史快照進行過培訓的系統表現不佳。
埃森哲公司負責歐洲數據和人工智能業務的Braun說,“企業可以卸載一些數據,訓練一些模型,并在實驗室中獲得相當好的模型提升,但是一旦把它重新融入組織,就開始出現問題。”
歷史數據樣本和通過實時系統傳輸的數據之間可能存在顯著差異,例如,實時檢測欺詐或發現洗錢行為,因為這些模型沒有經過訓練,無法識別其行為的微小變化。
他說:“如果某個用戶在某個時間點(可能是晚上、周六或周日)復制數據,那么這種情況將會凍結數據。這使得實驗室的分析非常容易。但是,當機器學習模型重新融入到實時系統中時,其情況會更糟。”
Braun說,解決方案是將數據科學家從生產技術方面放入一個單獨的孤島中。特別是,當使用實時數據構建模型時,將模型集成到生產環境中要快得多。
他說:“而且成功的情況要好得多。它完全改變了游戲規則。”
未經處理的非結構化數據
根據咨詢機構德勤公司最近的一項調查,62%的公司處理非結構化數據仍然依賴電子表格,只有18%的公司在分析工作中利用了產品圖片、客戶音頻文件或社交媒體評論等非結構化數據。
此外,德勤公司零售和消費產品戰略和分析實踐負責人Ben Stiller表示,該公司收集的大量歷史數據缺乏對人工智能有用的背景,或者以摘要形式存儲。
“數據限制當然可以從一開始就為失敗做好準備。”他說。
Stiller說,“然而,根據調查顯示,像Cooper這樣利用非結構化數據的公司,其業務超出其業務目標的可能性要高出24%。這真的需要企業對數據的看法發生根本性的轉變。”
例如,Cooper公司以大約15億個客戶文檔的形式擁有大量非結構化數據。因此,客戶服務代理會花費太多時間查找幫助客戶所需的文檔,有時還需要與客戶溝通回訪。
因此,該公司使用機器學習技術掃描了所有15億份文件,并仔細分析了第一批1.5億份文件,這些文件屬于200種最常用的文件。
Cooper公司的Sharma說,“現在我們有一個機器學習項目,它帶來了價值,并且現在正在實施中。”
當企業重返以前問題纏身的人工智能客戶服務項目時,除了加快客戶服務呼叫的速度,文檔分析還幫助創建一個更好的語言字典,供將來使用。
文化挑戰
除了數據外,組織問題對人工智能的成功提出了重大挑戰。
Sharma說,如果回到過去,他最初會專注于客戶在詳細解決問題時使用的語言,并讓主題專家與人工智能開發人員配合工作。
Sharma說,“必須讓客戶與我們的技術團隊一起合作,這樣的場景始終是最重要的,你必須讓他們一起共事,并使其成為一份全職工作。”
除非企業能從這些錯誤中吸取教訓,否則實現人工智能承諾的機會可能會減少,因為失敗的人工智能項目可能會讓投資團隊不再提供融資,并可能對員工和客戶滿意度產生負面影響。
Stiller說,“圍繞人工智能的早期失敗項目可能讓執行團隊放棄在這個領域的重大投資。這可能會導致企業落后于競爭對手。”
這一切都從企業管理層開始。正如德勤公司的調查顯示,企業高層對于人工智能項目的支持至關重要。Stiller說,“如果企業首席執行官提供支持,那么其業務目標的成功率可能會超過77%。”
因此,不要讓挫折破壞企業對人工智能的組織承諾,因為人工智能的長期方法會得到回報,他說,“隨著時間的推移,企業實施的項目越多,投資回報率就會越高。”