計算機很笨。
開發者寫下幾百萬行代碼,告訴計算機如何去做每一件簡單的小事。這種層面的實踐已經被沃森顛覆。IBM的認知計算平臺不是通過編程來做事情,而是通過編程來學東西。
「這是計算的第三個紀元,」沃森生態系統技術負責人Steven Abrams在Information Week(信息周刊)的一個訪談中說到。第一階段是依靠穿孔卡片計算機的機械計算。第二個階段是我們今天使用的輸入/輸出存儲的編程系統。
「我們現在對系統進行的是訓練和指導,而非編程,」Abrams 解釋到,「站在一個開發者的角度,你得學會教計算機怎么做。」
「我沒有在那個領域編程,無法做出回答。」
許多科幻類電視劇和電影中的機器人或計算機會使用這種陳詞濫調來回答意外情況下的提問。
這是一個好的出發點,理解如何為沃森平臺編程應用程序。
「你可以通過提問來調試沃森系統,比如『我們給了它正確數據嗎?』」Abrams說。「數據和測試足夠完整嗎?」
開發者有一整套數據集合,他們能夠通過30多個應用程序接口中的1個來「填飽」沃森。有些應用程序借口是基于XML或JSON格式的。熟悉這些格式的開發者知道如何與沃森互動,他解釋說。
Abrams拿癌癥研究舉例。一位人類醫生在進入醫學院之前要接受16年的教育,而這之后,他/她仍然要在通過醫師實習期和臨床實習期之后才能行醫。過了這道門檻,「人類醫生」還需要經過幾十年的實踐才能成為一個合格的癌癥專家。沃森可能需要2-5年的「學習」就能夠達到和「人類醫生」一樣博學的程度。
所學領域的復雜程度決定沃森會用多長時間來學習。
沃森的一大優點是自然語言處理——當語言欠缺準確性,或當相似的詞用來形容同一個物品時,處理這類問題的能力。這個能力可以用來理解用戶的意圖,Abrams解釋說。「如果這些詞有相同的地方,那么,其他詞匯預示著什么相同意圖呢?」
答案很復雜。
「訓練沃森的過程是從不確定到確定,從低準確率到高準確率,」Abrams補充到。總的來說,一個沃森驅動系統要傾向于從犯錯誤到少犯錯誤。但這也是模式的轉換,他強調說,因為程序員必須把他們對計算機的思考方式,從以決定性為基礎變為以可能性為基礎。如果沃森對信息的準確性有信心,它就會回答,反之,如果不確定這個答案是否正確,它就會保持沉默。
訓練計算機學習新技能
有兩家公司正在試驗基于沃森的應用,一家是Ampsy,它提供了一個分析社交媒體品牌出現率的平臺;另一家是SparkCognition,它提供安全分析。
Ampsy公司在音樂和娛樂產業涉足很多。公司的創始人兼CEO,Jeremy Gocke,在一次采訪中表示,「我們認為我們意識到的所有震撼內容…背后有很多數據。」
Gocke認為沃森和Ampsy分析平臺自然搭配,旨在發現和記錄實時活動中所有分享和發布社交內容的人。
Gocke舉出AC/DC音樂會這個例子。每個音樂會的舉辦地點會使用GPS進行地理限制。系統能掌握指定范圍內用戶的社交內容——甚至都不需要標簽。然后,某個旅游網站會分享所有的社交媒體發布內容。收集粉絲對音樂會各個部分喜好度的發布率的數據。通過沃森驅動的分析,能識別出那些「超級粉絲」,據此,他就能獲取免費后臺通道,在音樂會結束后與樂隊會面。
在大項活動中,通過使用沃森圖像API,結合品牌圖像識別,沃森表現更佳。在這種情況下,沃森能學會比對商標數據庫,「識別」品牌的名字或者商標。
Gocke談到,「品牌正在超越品牌本身,品牌正在變成體驗。」最終,一個品牌的產品可能融入一項活動,這樣任何參加活動的人都能展示出對該品牌的喜愛,或者品牌能顯示出對大眾的喜愛。
單靠這個分析平臺,Amspy是不可能推出這種體驗的,也不可能使人們給予同樣的評價。Gocke表示,只有沃森能滿足整理輸入大量數據的挑戰,能得出這種結果。
同時,SparkCognition正在使用人工智能作為SparkSecure產品的差異化因素。SparkSecure是一個安全事件和事故管理平臺(SEIM),它的底層是「認知洞見」,可以規模化系統,它在相同時間內能超過人類安全分析師。SparkSecure能根據已知的操作和使用類型,發現可疑人。挑戰在于吸收所有數據,繪制出IT場景。
公司的創始人兼CEO,Amir Husain在采訪中稱,「在提供數據時,這些算法會根據內部機制建立模型。」
「把沃森納入SparkSecure的咨詢師,可以處理更多數據,用以繪制公司的IT場景。這樣,沃森允許終端用戶知道發生的問題并作出相應處理。」
安保是無窮無盡的矛盾體系,道高一尺魔高一丈。壞蛋搞出新的入侵技術,好家伙就相應地發明防衛技術。在壞蛋發明新的入侵技術之前,防衛技術就占據優勢。結果是,「我們不斷給沃森增加新內容,」Husain談到,「我們生活在不斷變化的動態場景中。」
沃森的威力又一次得到了體現:規模化,自然語言處理,以及彈性學習能力。Husain稱,假設沒有沃森,SparkCognition的開發者就不得不無止境地建立診斷樹,希望使用了正確關鍵字,以覆蓋每一個安全意外事故。有了沃森,「提問不必那么精確。」用戶不需要去「猜」哪里問錯了,就能得到正確答案。
有沒有可能黑客用AI幫助其入侵?雖然目前還不可能,這樣的發展會有潛在問題。Husain表示,「IBM率先進入市場,這會讓提出更好算法變得很難或者成本很高,這個行業的新晉者會落后IBM2到3年。」
沃森,遇上 HAL
以沃森為代表的人工智能容易被誤認為HAL9000,后者是《2001:太空漫游》里的一個智能超級計算機。作者Arthur C. Clarke分別取I-B-M的前一個字母,把它命名為HAL。作為一個科幻角色,Clarke讓HAL無所不能。這個有自主意識的計算機在一次去土星的太空任務中,變成了一個瘋子,殺死了大部分艦員。
但是,我們不應把沃森當成HAL。IBM的Abrams指出,「沃森不會自己主動行動。沃森沒有意識。他不會排斥外界的詢問。」
他繼續指出,「沒有主觀能動性,它就不會失去控制。沃森有一個插口,」它可以被斷開。「無個人判斷時,沃森就不會被運用…沃森每個決定的最終決策…將永遠由人類根據從沃森那里獲得的信息做出。」