一項堪比“探月計劃”的行動正在緊密疇備中。
剛剛過去的2014年12月,IBM宣布將向公眾開放沃森分析平臺。沃森分析平臺與IBM的超級計算機“沃森”(Watson)屬于同一個項目,它能夠自動執行數據準備、預測分析和視覺化敘事(visual storytelling)等任務,可以為企業提供可視化的預測分析工具。
2014年年初,IBM正式成立沃森(Watson)集團,同時還公布了三項基于沃森認知智能的新服務:改變傳統研究方式的 IBM Watson Discovery Advisor、能夠從大數據中獲得洞察的 IBM Watson Analytics、幫助企業應對大數據挑戰的 IBM Watson Explorer。就在幾個月前的2014年夏天,IBM宣布將投資超過10億美元,以實現“沃森”項目的商業化。開放沃森分析平臺可以視為其商業化的最新進展。
在這家已有百年歷史的企業,成立事業集團一共只有四次:第一次是在上世紀60年代,大型主機360剛剛發布的時候;第二次是上世紀80年代,IBM向PC轉型;第三次是收購普華永道,成立全球咨詢服務部;第四次就是Watson。“歷史上IBM的四個大舉措都是行業中發生大轉型的時候,不論是當年的大型主機,還是后來的PC,以及隨后的行業解決方案。”IBM 沃森集團業務實施部副總裁Ed Harbour說,“成立沃森集團,圍繞的就是‘認知計算’這個時代,這會為企業及運行帶來根本性的轉變。”
從深藍到沃森
2006年誕生的沃森以IBM創始人托馬斯·J·沃森的名字命名。沃森超級計算機在2011年一鳴驚人,當年3月它在美國電視知識搶答競賽節目“危險邊緣”(Jeopardy!)中戰勝了兩位人類冠軍選手。在“危險邊緣”節目中,所有選手必須等到主持人將每個線索念完,第一個按下搶答器按鈕的人可以獲得回答問題的機會。沃森的基本工作原則是解析線索中的關鍵字同時尋找相關術語作為回應,沃森會將這些線索解析為不同的關鍵字和句子片段,這樣做的目的是為了查找統計相關詞組。沃森最革新的并不是在于全新的操作算法,而是能夠快速同時運行上千的證明語言分析算法來尋找正確的答案。在三集節目中,沃森在前兩輪中與對手打平,而在最后一集里,沃森打敗了最高獎金得主布拉德·魯特爾和連勝紀錄保持者肯·詹寧斯。
人機大戰中IBM的電腦獲勝已經不是第一次。早在1997年,沃森電腦的前輩、IBM公司的深藍電腦在一場著名的人機大賽中擊敗了當時的國際象棋大師加里·卡斯帕羅夫(Garry Kasparov)。“深藍”在下每一步棋之前,它都會計算出六個回合之后的局勢,憑借預設的快速評估程序,它能在一秒鐘內計算3.3億個不同棋局的走勢,從中選出一個得分最高的方案。而身為世界冠軍的卡斯帕羅夫,在走每一步棋之前最多只能評估幾十種方案。
深藍面對的是一個棋局,在國際象棋的棋盤上,每一步下法之后的情況說到底是可以窮舉的。以現在的技術水平來看,只要擁有足夠的計算能力,要想獲勝并不算難。“如果從計算角度來看歷史,第一階段是制表階段,從1959年開始進入了編程階段,也就是‘深藍’所處的階段;現在沃森所處的時間是第三個階段:認知計算。”Ed Harbour說。
沃森是能夠使用自然語言來回答問題的人工智能系統,關鍵在于沃森是一種認知技術,處理信息的方式與人類(而非計算機)更加相似,它可以理解自然語言,基于證據產生各種假設,并且持續不斷地學習。“IBM深藍計算機曾經戰勝過國際象棋的世界冠軍,但是從IT技術來講,沃森系統的成就對人類的影響是遠遠地超越了深藍計算機當時的成就。”IBM中國研究院院長沈曉衛說。
不僅會“計算”,還要能“思考”
“在認知計算階段,并不是通過計算機編程,而是讓計算機能夠了解自然語言、能夠提供對人類的支持和幫助,具有自然語言的處理能力,來為我們提供建議和支持。”Harbour介紹說,沃森通過解讀非結構性數據,并且模擬人腦的感知來運作。
人工智能所追求的最終目標不在于充當“工具”,而是要最終成為能夠理解人,擁有與人類類似的情感和思維方式,并且能夠幫助人的“顧問”。對于計算機而言,在能夠處理非結構性數據,可以解讀人類自然語言之后,更難的是“讀懂”隱藏在這些數據和語言之后的人。只有讀懂人,才能使沃森真正成為服務于各行各業的“助推器”,充當一個“顧問”的角色,而不是一個簡簡單單的“工具”。
“認知計算會從基礎上支持人工智能的發展。”IBM杰出工程師、系統與科技事業部大中華區首席技術官李永輝說,“認知計算的特點在于從傳統的結構化數據的處理到未來的大數據、非結構化流動數據的處理,從原來簡單的數據查詢到未來發現數據、挖掘數據為重點。”感知人類的情緒,甚至像人類一樣擁有情感,是所有人工智能機器“擬人”的終極難題。在IBM的“大數據挖掘技術”支持下,在一段段支離破碎的自然語言背后,一個個具體的,有愛惡,有性格有偏好的人格形象,被漸漸地“扒”了出來。
“您好,我是客服代表沃森。”2013年6月,IBM推出了基于Watson的全新技術:IBM Watson
Engagement Advisor。沃森可以理解人類語言的細微差別,從而用人類的方式思考問題,從海量的大數據中挑選信息,根據用戶的需求做出有根據的回應。
沃森通過對人類自然語言的分析與解讀,就可以了解到藏在這些語言背后的情緒和性格。“比如投放廣告之后這群人的反應,沃森可以分析出來,這對我們企業做廣告投放是非常有幫助的。”Harbour介紹說,“我們可以分析社交媒體的微博、Facebook,能夠了解某個人的愛好或者喜好,也可以針對某一群人了解他們的愛好和喜好,可以使企業在正式推出產品之前,就能夠了解客戶的反饋。”
要解決這一難題,就不是簡單地擴充數據庫和提高運算速度。IBM的技術人員為Watson構筑了各種各樣的模型,他們會標注一些“樣本”,比如“梅西”是一個人名,“球星”是一種身份,代表人名和身份的詞語出現在語言結構中的特征是不一樣的。技術人員從中找出一些內在規律,其中可能包含幾十種特征,構建出一個模型,讓機器自己來學習。“Watson就像一個聰明的小孩,你教他什么他就會什么。Watson不是通過寫程序來實現的,它是特別有學習能力的機器。”IBM研究院認知技術首席技術官高雨青女士說。
和沃森大廚一起共進晚餐
“沃森大廚”在2014年頻繁露臉。“沃森大廚是
一個最新的進展,它預示著沃森能夠解決日常生活的需求。”Harbour解釋說,“沃森能夠分析人類的味覺,通過味覺分析來滿足個人的食品愛好。”沃森不僅具備學習、存儲和查詢大量菜譜的能力,而是一位真正“大廚的決策助手”,它可以綜合對口味偏好、菜式、營養學和食物化學的考量,創造性地提出很多食譜建議。
2014年9月,IBM與美國知名美食雜志Bon Appetit合作推出食譜App。在這個App中,使用者只需輸入想使用的和不喜歡的食材,再制訂想嘗試的風味,以及希望做成的菜式,沃森就立刻生成超過100種食譜,包括偏傳統的和偏創新的菜肴。
下面是沃森跟使用者之間的對話:
使用者的屏幕上出現沃森的問題:你最愛什么食材?
他輸入了“西藍花”和“牛肉”;
沃森接著提問:你最不想吃到什么食材?
他回答“洋蔥”;
接下來的問題是:你喜愛什么風格的菜肴?地中海還是亞洲式的?
他輸入了“地中海”;
屏幕上出現的最后一個問題是:這道菜你想用在Party上還是用作燭光晚餐?
他寫上了“燭光晚餐”。
三秒鐘過后,超過一百種符合他要求的菜肴食譜盡收眼底。
和沃森參加的“危險邊緣”節目中搶答訓練同樣的原理,首先,沃森會獲取全世界所有已知的食譜,將食物分類并分解其中的化學成分,接著加入人類對這些食物的味覺印象,作為食物是否好吃的憑據,這些資料最后會放入“食譜數據庫”中,然后,運用它的新型算法(Novel Algorithm),即能分析出食物的分子結構,如表層、重原子數、旋轉鏈數、氫鍵受體數等,然后再將這些資料放入“營養數據庫”。最后,沃森通過分析這兩個數據庫,推薦合適的食材,從而搭配出意想不到的食譜。與之前的超級計算機相比,沃森有發現的能力,它能夠幫助我們做分析,找出一些特定的模式,它能夠分析食品的化學成分,滿足我們對美食的偏好,提供不同口味的食品。
《連線》創始主編凱文·凱利此前曾在IBM實驗室里品嘗了沃森大廚的創造,“其中一款由沃森創造出的受人追捧的菜肴是美味版本的“炸魚和炸薯條”(fish and chips),它是用酸橘汁腌魚和油炸芭蕉制成。在約克城高地的IBM實驗室里,我享用了這道菜,也吃了另一款由沃森創造出的美味菜肴:瑞士/泰式蘆筍乳蛋餅。”凱文·凱利說,“味道挺不錯!”
李永輝說,贏了第二次人機大戰以后,IBM就希望把Watson商品化,透過它的技術融入到IBM的產品,也結合不同的行業專家一起做。首先IBM選擇的是醫療行業,主要希望來解決人類目前解決不了的癌癥治療難題,或者說是為治癌癥提供一種建議。
不只是“工具”,還得是“顧問”
“認知計算作為一個概念早已存在,但最近正在不斷取得突破,并將有可能深刻改變人類生活。”在沈曉衛看來,在認知計算時代,計算機的運算處理能力將與人類的認知能力完美結合,完成人類或機器無法單獨完成的任務。沈曉衛認為,認知計算的能力主要體現在四個層次:第一個層次是輔助能力。在認知計算系統的幫助下,人類的工作可以更加高,百科全書式的信息輔助和支撐,可以讓人類利用廣泛而深入的信息,成為各個領域的“資深專家”;第二個層次是理解能力。認知計算系統可以更好地理解我們的需求,并為我們提供相應的服務;第三個層次是決策能力;第四個層次是發現和洞察的能力,可以幫助人類發現當今計算技術無法發現的新洞察、新機遇及新價值。“認知計算系統的真正價值在于,可以從大量數據和信息中歸納出人們所需要的內容和知識,讓計算系統具備類似人腦的認知能力,從而幫助人類更快地發現新問題、新機遇以及新價值。”沈曉衛說。
沃森正是這樣一種認知技術,“沃森大廚”是 IBM 在食品領域探索和驗證其研究成果的一次嘗試,這項認知技術在人類社會的應用前景實際上要廣泛得多。IBM 副總裁、大中華區全球企業咨詢服務部合伙人詹森?凱利 (Jason Kelly) 認為:沃森在改變醫學教育和支付方式,加速科學研究發現,未來在零售、快消、旅游等行業都可以發揮價值。比如在醫學領域,實際上沃森已經在美國一些地區獲得了行醫執照,可以通過口語對話方式,與臨床醫生診斷病情,甚至商議治療方案。
在醫療項目中,“沃森”超級計算機的應用在于,能夠幫助醫生更好地診斷病人的疾病并能正確地回答醫生的疑難雜問。“沃森”超級計算機被培訓以掌握世界頂級醫學出版物上的醫學信息和資料;然后憑借這些信息和資料去匹配病人的癥狀、用藥史和診斷結果;最后形成一套完整的診斷和治療方案。由于“沃森”超級計算機能夠掌握現代醫學的海量信息,所以這一技術進展的意義也非常重大。“醫生這個職業一生需要學習很多,但是很多醫生走上工作崗位之后就沒有時間讀書讀資料了,他的知識也可能會很快老化,尤其是那些研究、發展特別快疾病。”鑒于強大的對自然語言的處理能力,沃森可以“幫”醫生讀這些書,而且讀得更快更多,并且永遠不會忘記。據IBM估計,如果想要與相關的醫學信息和資料保持同步,一位人類醫生每周需要花費160個小時閱讀這些信息和資料。
“這種顧問是基于實證的,基于以往經驗的:一旦醫生提出一個療法,沃森可以幫助醫生查根據是什么,包括查詢基因組和相關的病例,幫助醫生證明這個療法是正確的。”Harbour介紹說,“沃森目前已經吸收消化2400多萬個醫療上的文獻,而且永遠不會忘掉。”
雖然沃森已經可以充當“顧問”的角色幫助醫生。“然而,如果未來的某一天‘沃森’醫生能夠成為全世界最出色的診斷醫生,也并不是一件不可能的事情。”麻省理工學院斯隆管理學院教授埃里克·布萊恩約弗森甚至預測。
理解沃森的關鍵,是這項技術實現了機器從“計算”到“思考”,再到“創造”的飛躍。
沃森不僅具備學習、存儲和查詢大量菜譜的能力,還是一位真正的“大廚決策助手”,它可以綜合對口味偏好、菜式、營養學和食物化學的考量,創造性地提出很多食譜建議。