人工智能的歷史上有很多革命性的時刻,各種各種理論和技術突破正將類似于人類的智能裝入機器之中。
其中最值得提及的包括80年代的「專家系統」,90年代擊敗人類冠軍象棋手的IBM深藍(Deep Blue)計算機,以及最近能夠通過觀看YouTube視頻學習識別貓的谷歌的人工智能系統。
但要將這些引人眼球的技術變得有實用價值卻并不簡單。微軟聯合創始人Paul Allen創立的人工智能實驗室的負責人Oren Etzioni說,這些人工智能中的大部分都是為展示特定狹窄領域內的新計算技術而開發的,要將這些技術應用到更寬泛的問題上則面臨著嚴峻得多的挑戰。
目前來看,還很少有技術敢宣稱能夠達到或超過IBM沃森系統的能力,該計算機系統有希望將人工智能推進到普通的商業世界。沃森(Watson)系統得名于打造了現代IBM的首席執行官Thomas Watson Sr。5年前,該系統因在美國的電視問答節目Jeopardy!上擊敗了兩名人類冠軍選手而開始廣為人知。
但沃森進化成實用的商業工具之路卻并不那樣平坦。在不斷使用沃森來解決了其它計算機無法解決的許多單一問題之后,2014年IBM開始調整自己的策略了。
IBM不再將沃森作為一個單一系統開展業務,而是將其功能分割成了幾個不同的組成部分,其中的每一個部分都可以被租用出去以解決特定的商業問題。目前IBM在沃森系統上已經開發了40種不同的產品,其中包括常見的語言識別服務和一些更為雄心勃勃的擴展應用。
盡管IBM目前還沒有公布沃森各個組分的性能表現,但該公司表示這一模式已經取得了成效。IBM高級研究副總裁兼負責人John Kelly表示沃森系統已經變成了「我事業生涯中所見過的最大最重要的東西」,而且同時也成為了IBM收入增長最快的新業務。
但批評者說IBM現在掛牌「沃森」銷售的服務和當年參加Jeopardy!比賽的沃森根本不是一回事,現在的「沃森」只是一個聽起來高大上的品牌,其中的技術其實并沒有宣傳的那樣有革命性。
Etzioni對此評論說:「他們的方式只會適得其反,更負責任的做法是坦率地承認一個系統能做和不能做什么,而不是兜圈子式地炒作。」他還表示,IBM過去5年所做的一切都讓人看不出原來的沃森是現在解決現實世界問題的核心技術。
沃森的案例
圍繞著沃森能力的爭論不僅僅是一個學術活動。IBM的傳統IT業務正在不斷萎縮,客戶也隨之遷移到了新的云技術上,沃森這時候就在IBM努力證明自己的現代商業服務能力中扮演了極其重要的角色。而這就成為了首席執行官Ginni Rometty在接手IBM四年之后努力扭轉公司生存狀態的關鍵。
沃森現在的名氣依然和當初在Jeopardy!上的成功息息相關。西北大學計算機科學教授Kris Hammond說:「那是所有人都以為不可能完成的事,它的行為違背了我們對機器的認知,它做了一些我們以為只有人類才能做到的事。」
通過解讀措辭含糊的問題并通過其通用知識數據庫搜尋答案,沃森展示了理解自然語言的能力,而這正是計算機所需要攻克的最困難的難題之一。這次演示似乎預示著計算機不久之后就能真正「理解」復雜信息并與人類交談了,甚至還可能繼續發展以至于在大部分人類專有領域超越人類。
IBM面臨的最大挑戰是如何將這一能力應用到比游戲節目更加復雜的信息處理和答案搜索中;對一些客戶來說,這可比預想的困難多了!
德克薩斯大學的MD安德森癌癥中心從三年前開始訓練這一系統以幫助識別病人病癥,以便醫生做出更好的診斷和治療方案。
「這并沒達到我原來預想的程度,我們還遠沒到達終點。」德克薩斯大學醫療系統創新領頭人Lynda Chin評論說,「這實在非常非常困難。」她說要將玩文字游戲的計算機訓練成一位腫瘤學專家和聽起來一樣幾乎不可能。
這個系統的一部分程序是用來消化現實世界的信息的,然而光是讀取和理解醫生的筆記就給計算機的采集和整理系統構成了嚴峻的挑戰,更何況還有更深層次的認知論問題。Chin說:「在Jeopardy!上,問題總有一個正確的答案」,但在醫療領域,只有根據信息導出的意見。
Kelly否認IBM低估了類似挑戰的難度,還表示說目前有很多醫療機構都在準備引進類似的網絡診斷系統。
技術的應用
IBM最初的計劃是將沃森應用到非常困難的問題中,在早期宣布的「登月」計劃中包括「終結癌癥」和加速非洲發展這樣的社會焦點難題。然而遺憾的是,有關這些項目的報道新聞還墨跡未干,IBM就已然放棄了。比如IBM曾和花旗銀行合作探索在各種銀行活動中使用沃森系統,但很快這一計劃就不了了之。
經過了2014年的調整之后,IBM開始使用「沃森」品牌開展業務。客戶可以通過API調用的方式將IBM的服務作用自己的計算組件使用,其中包括情感分析(搜集推文等信息對情緒進行評估)和個性化追蹤(使用52種不同的特性測量個人的在線輸出并進行判定)。
而在大部分客戶的想法里,Kelly說,他們還是有一些雄心勃勃的「登月」計劃,并希望有一天能通過全功能的沃森加以解決。但他們的主要動力還是來自于期望短期內改善自己的業務,Kelly認為光是滿足這一點就已經意義非凡了。
這種更加務實的態度已經為IBM帶來了實際的收益,但卻將推遲了真正大問題的解決。澳大利亞能源公司Woodside這樣的客戶使用沃森的語言能力打造先進的「公司內部知識庫」搜索引擎。在將30年積累的20000多份項目文檔錄入到沃森系統之后,該公司的工程師現在可以用它來學習過去的經驗,比如計算特定管道的最大承壓。
但人工智能世界的批評意見認為,新的組件化的沃森和原來的沃森技術突破關系不大。Hammond批評說:「感覺就像他們把很多東西都塞進了沃森的品牌下,但這并不是沃森。」
Etzioni也這么認為,他進一步表示IBM在Jeopardy!上的沃森的實際應用開發上一事無成。他說:「沒有證據表明IBM可以將狹窄領域內的成功復制到更寬泛的應用領域。」對于沃森品牌下的一眾服務,他補充說:「我并不清楚其中一個單一的、非常精彩的應用。」
但對IBM來說,這樣的抱怨并不是重點。Kelly說:「任何使用沃森品牌的服務都是非常高端的人工智能、機器學習和高速非結構化數據。」Jeopardy!上的比賽已經過去了五年,沃森系統已經遠遠超過了當時,并增加了圖像識別等新功能,大大加強了其處理現實世界信息的能力。
系統的采用
不過就算沃森辜負當初的承諾,這樣的爭論其實也沒多大關系。如果早期的使用者能夠在自己的行業中訓練和使用這一系統,那么其能力必然是逐漸擴增的。
Woodside技術和戰略主管Shaun Gregory說:「只要它是有效的,你就想率先采用。你就在知識和學習上領先了,機器不會忘記。」
沃森的早期使用者面臨的另一個挑戰是機器系統所給出的答案究竟有多少可信度。MD安德森癌癥中心的Lynda Chin表示,其概率性的處理方法非常類似于人類,經過了專家的訓練之后,它會作出類似人類的判斷,同樣帶有偏見。
在商業世界里,只能給出問題的答案卻并不能進行解釋的智能機器用處不大,Hammond說,「如果你走進CEO的辦公室說我們需要關閉三家工廠并且裁員,CEO的第一個問題就是:『為什么』。光是生成一個結果是不夠的。」
他補充說IBM還在繼續推進系統透明化的嘗試,其中包括用戶可以使用一款名叫WatsonPaths的可視化工具來簡單了解結論生成的機制;但總體而言,這一條路并不平坦。
Kelly說沃森的決策路徑完全嵌入在系統內部,它們是非常復雜的。但他補充說:「我們可以倒回去找到沃森為了導出答案而連接的數據點。」
他還將IBM和其它公司的技術進行了對比。谷歌和蘋果等公司的人工智能的主要作用是為增強自身的服務或提高廣告系統的效率,只有IBM一家在嘗試讓這一技術對商業世界更加透明,他認為:「我們可能是唯一一家打開黑盒子的公司了。」
即使在沃森經過挫折之后,MD安德森癌癥中心仍然相信最好在新技術開始時就使用它。
「我仍然相信其能力可以發展到我們所認為的程度」,Chin說,使用這項技術將全球的腫瘤學專家推理能力交付到其它醫生手里本身就已經意義深遠了。「和亞馬遜用來改進零售和購物一樣,它也將改變醫療保健服務。」
Chin補充說沃森不會是唯一一個用來醫療衛生信息化改造的推理引擎,還需要其它技術來補充它。
沃森游戲勝利的5年之后,IBM終于成功啟動了商業領域的人工智能革命。現在,它終于要開始實現的諾言了。
核心資產:不同數據流向的系統
在領先的科技公司開發更高效人工智能的競賽中,還有一個秘密武器:獲得大量數據。對IBM來說,因為其希望將沃森打造成商業世界人工智能標準,這可能將成為其一個被低估了的優勢;據一些專家介紹,智能機器的核心是通過算法在海量數據中發掘模式并作出推測。機器學習是近來人工智能發展進步的基本技術,它就依賴于通過大量數據對系統進行訓練。
西北大學計算機科學教授Kris Hammond說:「現在人工智能領域的新興技術都涉及到數據。」
而近來人工智能技術的飛速發展也和網絡在線數據的膨脹密切相關。比如谷歌就在通過搜集用戶豐富的在線行為數據來優化其搜索系統。但IBM的數據體量并不能和谷歌所擁有的數據寶庫相媲美,量的缺乏只能希望通過特定行業的細節數據進行彌補。「谷歌只有一種數據——用戶情緒數據。我們則有大量(更多樣化的)數據。」IBM研究部分負責人John Kelly說。
特定領域的數據越多,其在解決該領域問題上就越智能。隨著IBM的客戶不斷地向沃森輸入自己的企業數據并對沃森進行訓練,IBM得到的好處也越來越大。
Hammond說,沃森「在許多領域擴增的信息體量」將會成為IBM在人工智能競賽中最主要的資本之一。
去年,IBM進行了一些收購以擴增其數據儲備,其中包括10億美元買下擁有大量醫學圖像數據的Merge Healthcare。這些數據現已整合到了沃森健康(Watson Health)之中,而沃森健康也成為了第一個從沃森之中拆分出去的專業業務。
另外IBM還花20億美元買下了Weather Company公司的數字資產,這些資產將幫助IBM建設更好的有關天氣和商業的預測系統,可以實現根據天氣預報評估商業風險等功能。
Kelly說:「從我們的客戶那里和我們的收購中,我們積累了相當多的數據集。」
當然,要將這些原始數據變成計算的金礦仍然需要真正的技術。但如果能說服客戶貢獻自己的數據來幫助沃森變得更聰明,那么必將給IBM帶來先聲奪人的巨大優勢,競爭對手再要趕上可就難了。