1955年,當人工智能這個詞首次被提出來時,不出所料地點燃了公眾的想象力。在接下來的60年里,我們有好幾次都被它的前景所吸引,擔心它的潛力被濫用,但又為它的發展緩慢而沮喪。
然而,正如所有孕育得過早、超越了當前時代的先進科技一樣,人工智能遭到了廣泛的誤解——被好萊塢電影錯誤地詮釋、被媒體曲解為各種各樣的角色,從人類的拯救者到毀滅者,應有盡有。但那些真正參與到業界的嚴肅信息科學研究和應用的人卻很理解智能系統的巨大潛能。這種技術(我們相信那將是「認知智能」而非「人工智能」)的 未來與大眾冠以AI的名頭大不一樣,將涉及各種各樣的、來自技術、科學和社會的挑戰與機遇,面臨不同的監管、政策和管理需要。
認知計算是指一種能夠規模化學習、有目的推理、并與人類自然交互的系統。它們不需要事先精確地編程,而是從它們與我們之間的交互和與環境之間的互動中學習和推理。過去半個世紀中,多個科學領域的發展使這些事情變得可能,它們與那些運行著它們的信息系統有著重要的區別。
那些信息系統是決定論的,而認知系統是概率性的。認知系統不僅能回答大量的問題,還能對更加復雜(且有意義)的數據提出假說、推理論述和建議。
此外,認知系統還能理解計算機科學家稱之為「非結構化」的數據,而這些數據占到了全世界數據的80%。這使得它們能夠跟上現代世界巨量、復雜和不可預測的信息。
這些與機器的感覺能力和自主性都沒有任何關系。相反,它能夠增強人類的能力,讓我們可以理解和運作社會中復雜的系統。這種增強智能對提升我們駕馭科技的能力是十分必要的一步,讓我們能追尋更多知識、提升我們的能力和改善人類的境況。這就是為什么它不僅是一種新科技,還是科技、商業和社會新紀元——認知時代的黎明。
認知計算的成功并不以圖靈測試或模擬人類的能力作為判斷標準。它的標準更加實際,例如投資報酬率、新的市場機會、治療疾病和拯救生命。
在IBM,為建立認知計算的基礎,我們已經工作了數十年,將前沿計算機科學領域的十幾個學科與這個100多年的商業專家結合起來。現在,我們正在親眼目睹它在改變商業、政府和社會方面的巨大潛力。
我們已經看到,它將大數據從障礙變成機會,幫助兒科醫生做出早期診斷,為建設智慧城市提供創新解決方案。我們相信,這些技術展現了最好的(或許也是唯一的)機會,去處理地球面臨的一些最持久的系統性問題,例如癌癥、氣候變化和復雜多變的全球經濟形勢。
計算的歷史與認知的崛起為了理解認知計算的未來,必須把它放到歷史的語境中。
到今天為止,我們經歷過兩個不同的計算時代——制表時代和編程時代。IBM在這兩個時代中都扮演了重要的角色。我們相信,在計算演化史中,認知計算是第三個、也是最具有轉折意義的時代。
制表時代 (1900-1940年代)計算機起源于一種單一計數用途的機械系統,這種系統用打孔卡來輸入和存儲數據,最終決定這個機器要做的事情 (雖然是以一種非常原始的方式)。這些制表機本質上是一種計算器,支持了商業和社會規模的擴大,幫助我們組織、理解以及管理從人口增長到全球經濟進步等的各種事情。
編程時代 (1950年代-現在)在二戰的時候,隨著軍事和科學的需要,從機械制表機到電子系統的演變開始了。在戰爭之后,數碼「計算機」經歷了快速演化,逐漸進入商業和政府。它們可以根據軟件中的程序來進行 如果/就 的操作以及循環。從最開始的電子管到晶體管,再到微處理器,計算機的性能得到了迅速提升,這一發展過程驗證了「摩爾定律」,在60年間,每18個月處理器的容量和速度就提升一倍。所有我們知道的計算設備,從大型主機到個人電腦,再到智能手機和平板,都是可編程的計算機。
認知時代 (2011-)早在1960年,J.C.R. Licklider就在他的論文「人-機共生」中 提出了 超越可編程系統的潛在可能性。現代計算的很大部分都是基于LickLider的研究以及他的深刻見解:
「人-機共生」是在人類與電子計算機之間發生的共生關系,是人機關系間可以預見的發展。這種關系包含人類與電子伙伴強耦合關系。主要目的是:
像為解決規劃難題提供便利一樣, 也讓計算機為規劃思維提供便利。
在不依賴于不靈活的預定義程序的情況下,讓人與計算機能夠協作決策,控制復雜情況。
初步分析表明,與人類單獨進行智能操作相比,共生關系將會更有效。
——J.C.R. Licklider,「人機共生」,1960年3月
Licklider知道,認知計算將是程序化計算的必要的自然演化,雖然他并不知道這個目標如何實現。50年后,大規模并行計算以及浩如煙海的結構化與非結構化數據的積累,為認知計算奠定了基礎。
世界首個認知系統在2011年2月,Watson項目首次公開,Watson是IBM開發的認知計算系統,它在Jeopardy!節目中戰勝了肯·詹寧斯和布拉德·魯特爾。這是首次面向公眾證實認知計算,標志著所謂AI寒冬的終結。可編程系統在之前60年的演化中并未能夠理解混亂的非結構化數據,因此也參加不了Jeopardy!節目。Watson能夠回答微妙、復雜、語義雙關問題,顯然,計算新紀元即將開啟。
節目之后,Watson繼續處理了更多的復雜數據集,在解謎之外,它發展出了理解、推理以及學習的能力。認知計算的目標就是照亮以往在我們世界中不為人知的部分——具體來說就是潛藏在非結構化數據中的模式和洞察——使得我們能夠對更重要的事情做出更明智的決策。認知時代的真正潛力將會是機器的數據分析、統計推斷能力,以及人類特殊能力,比如自我引導的目標、常識和價值觀。
這正是Watson被賦予的使命,也是它正在嘗試做的事情。銀行正在分析客戶要求和金融數據,幫助自己更好地做出投資決策。高度監管產業中的企業不斷在系統中查詢,保證自己跟上經常變化的監管和合規標準。腫瘤學家利用專家經驗和研究手段,測試認知系統能否幫助他們理解癌癥患者醫療信息,找到個體化、循證的治療方案。
這樣的經歷對于牽涉其中的專業人士來說意味著什么?世界知名的腫瘤學家,紀念斯隆-凱特琳癌癥中心的Larry Norton博士正與Watson合作幫助內科醫生對患者進行個性化癌癥治療。他說:「計算機科學發展迅猛,醫療事業也會受其影響。這被稱為協同進化(coevolution)。我們要互幫互助。我預想這樣的場景:病人、電腦、我的護士、我的研究生同事還有我自己都在監察室一起交流。」
在Watson的象棋博弈前輩Deep Blue在1997年擊敗世界象棋冠軍Garry Kasparov之后,我們首次看到這種共生的跡象。在那次演示之后,Kasparov繼續參加這種新「自由式」的象棋聯賽,在其中,選手們可以自由地使用任何他們喜歡的計算機程序。在這些聯賽中,一些選手孤身奮戰。一些完全依賴于計算機程序。但那些將計算機與他們自身的直覺和比賽天賦相結合的選手是最成功的。
「機器與人相配合的團隊甚至比最強大的計算機更具優勢。人類策略上的指導與計算機戰術上的敏銳結合起來是所向披靡的。我們可以集中精力于策略規劃而不是把那么多時間花費在計算上。在這些情況下,人類的創造力是最重要的。」
——加里·卡斯帕羅夫
前行的技術之路與何以可能的科學當Licklider為認知計算幫忙想出一種哲學方法時,他幾乎無法表達出前行的技術進路。那條道路仍在被定義,不斷調整。尤其是,我們敏銳地意識到數據正怎樣塑造著我們的未來。Gartner預計世界的信息將增長800%在未來5年,而且80%的數據是非結構化的。包括人類語言記載下的每一件事(從教科書到詩歌),圖片捕捉到每一個瞬間(CAT掃描每個家庭照片)以及聲音記錄下的每條信息。它是隱藏在氣味、味道、文本和振動中的數據。它來自我們的活動,來自這個布滿儀器的星球。
在價值日益源于信息、知識和服務的社會和全球經濟中,數據代表著這個世界上最富有,最具價值,最復雜的原材料。直到現在,我們還沒有方法對它進行有效開采。
可編程系統基于這樣的規則:通過一系列預先設定的進程,從數據中得出結論。盡管它們強大而復雜,也是決定論的——其繁榮建立在結構化數據之上,但是無法處理定性或不可預見的輸入。面對正在興起的充滿模糊和不確定性復雜新世界中的眾多方面,這種死板束縛住了它們的拳腳。
認知系統是基于概率的,意味著它們被設計成去適應和理解非結構化語言的復雜性和不可預測性。他們可以「讀」文本、「看」圖像、「聽」自然語音。它們闡釋那些信息,整理它以及提供他們意思的解釋,還伴有它們結論的基本原理。他們不提供最終的答案。事實上,他們并不「知道」答案。相反,它們被設計成從多個來源中去衡量信息和想法,去推理,然后提供假說以供參考。一個認知系統給每個有潛力的洞見或答案分配一個自信水平。
Watson在 Jeopardy!中犯的一個錯誤就是例證。在第一天的比賽將結束時, 「Final Jeopardy」的類目是「美國城市」。線索是「以二戰英雄命名的最大的機場;二戰的戰役中第二大的。」答案是芝加哥(O’Hare 和 Midway)。Watson猜測為多倫多。Watson困惑于這個問題有很多原因,包括它的語法結構,在伊利諾斯州有一個城市叫Toronto并且Toronto Blue Jays在美國棒球聯盟中打棒球。
結果,Watson自信水平出奇得低:14%。如果這是Jeopardy!常規線索,而不是「Final Jeopardy」階段的線索,參賽選手很可能會響鈴,但是Watson不會響鈴,因為答案自信水平太低。Watson知道哪些事情是它不知道的,圖2中的5個問號暗示了這一點。
然而,認知系統能夠從錯誤中學習。通過大規模機器學習,認知系統能從訓練和運用中不斷得以改善。
消化語料庫知識,根據任何給定主題接受專家訓練,認知系統可以通過一系列Q&A的方式得以訓練。人與系統互動,就系統反饋的正確性做出反應將會提升機器的「知識」。
當Watson參加Jeopardy!時,它完成了一件事——以五種技術為基礎的自然語言Q&A。今天,Q&A僅為Watson眾多以API方式提供的功能之一。打那以后,我們已經研發出多達20多個新的API,采用了50多種不同認知技術。這也是認知計算的技術進路和當前人工智能進路的關鍵區別。認知計算并不是計算機科學的孤立領域。需要許多學科知識,從硬件架構,算法策略,工業流程設計到行業專長。
我們每天使用的許多產品和服務——從搜索引擎廣告應用,社交媒體網站面部識別到「智能」汽車,電話和電網——正在見證人工智能的方方面面。
絕大多數人工智能產品和服務都是為了實現某種功能目的,側重應用,專為某種特定服務而設。它們使用了一些認知計算的核心功能。一些使用了文本挖掘技術。其他的采用機器學習進行圖像識別。所有的產品和服務都局限于最初打造它們的構想。
相反,認知系統有五個核心功能:
1.與人的接觸更加深入。
人們與系統的互動更加充分,這種互動是以每個人偏好的模式、形式以及質量為基礎的。它們充分利用搜集到的數據創造出有關個體的精細畫面——比如,地理位置數據,網頁互動,交易歷史,鐘愛節目的模式,可穿戴設備數據和電子醫療記錄——并為這幅圖景添加一些很難察覺的細節:品味,情緒,情感狀態,環境條件以及人際關系本質和強弱。從所有結構和非結構數據中進行推理,找出什么才是人際交流中重要的東西。通過不斷學習,這些接觸交流將傳遞出越來越大的價值,也會變得更加自然,有預見性,情感也會拿捏適中。
2.規模化和提高專業技能:
各種工業知識和專業知識正在以任何專家不能趕上的速度迅速膨脹——雜志、新協議、新立法、新實踐和嶄新的領域。醫療保健中有一個明顯的例子,在1950年,人們預測全世界醫學知識翻一番需要50年時間;到了1980年,時間縮短為7年;2015年,不超過3年。與此同時,個人一生能產生一百萬GB的健康數據,相當于3億本書。
為了幫助組織機構跟上步伐,人們設計了認知系統,它能作為專家的伙伴以提高他們的業績。由于這些系統掌握了專業術語——醫學、銷售和烹調等術語——他們能夠理解和傳授復雜的專業技能。縮短了由內行變為專家所需的時間。另外,由于這些系統是由領先的從業人員訓練的——不論是顧客服務,腫瘤診斷,還是判例法等任何行業——系統就能讓很多人獲取這些領先人士的秘訣。
3.用認知融合產品和服務:
認知技術讓感受、推斷和了解用戶和周圍世界的新一類產品和服務成為可能。持續改善和適應,增強功能以推出未曾想到的新用法,也因此成為可能。在汽車、醫療設備、器具和玩具行業,這些正在發生。物聯網正在急劇拓展全球的數字產品和服務——哪里有代碼和數據,哪里就有認知技術的用武之地。
4.認知運營成為可能:
認知也能轉變公司運營的方式。融合認知功能的商業運營,能將內外資源中的數據表象化為財富。它讓公司重視工作流程、文本和環境,這有利于持續性學習、改善預測和提高運營效率——以當今的數據流動速度做出決策。在這樣的領域,比如市值平均10億美元的公司每周花1,000人的工作時間用于供應商管理,這就是個好消息。
5.提升探索發現:
最終,認知商業將會擁有的最強工具是好得多的、可以照亮日益復雜又不穩定未來的「前燈」。
隨著各行各業的領軍人物爭相在藥物研發、復雜經濟模型、材料科學、初創公司上放上大籌碼,這樣的「前燈」變得越來越重要。把認知技術運用到大數據上,領軍人物能找到規律、機會和可執行的假設,僅僅通過傳統研究或可編程系統,幾乎不可能發現這些。
假如能像設想的那樣實現認知計算,那么,底層平臺必須足夠寬廣、足夠柔性,以便在各行各業得到運用,它還必須支持跨行業運用。這需要一種全盤的研發進路,旨在打造一個強健的平臺,它有許多功能可以支持來自開發者生態圈各種各樣的應用。
這個平臺必須涵蓋機器學習、推理、自然語言處理、語音和圖像識別、人機交互和對話和敘述生成等等。許多功能要求運用高性能計算,專門的硬件結構,甚至是新的計算范例這樣的專業基礎設施。每種技術都源自自身科技或學術領域。但是,這些技術必須和支持認知結果的硬件、軟件、云平臺和應用協同發展。
隨著沃森的迅速演化,未來可能已初見端倪。舉個例子,一種分析X光,MRIs和超聲波圖像的認知醫學圖像應用,它能處理醫學期刊、書本和文章的自然語言。它利用機器學習來矯正和增強理解力。它還可以開發深度知識表征和推理,有助于形成可能的診斷結果。為此,需要專門圖像處理器來支持大規模數據和人類專業知識,指導系統學習, 解讀系統生成的結果。
這種新模型的威力能用到任何領域。油氣公司能把地震圖像數據和對成千上萬的論文、報告、時事、經濟數據和天氣預報的分析結合到一起,為開采提供風險回報分析。或者,通過分析測試成績、出勤率和數字學習平臺上學生行為信息,學校能建立縱向的學生檔案和個性化教育計劃。
IBM正在與多個領先的癌癥研究機構合作,加快臨床識別,為患者提供個性化治療方案。它也被認為是短期內最有前途的認知計算應用之一。該計劃旨在減少醫學解讀DNA的時間,了解個人遺傳信息,從醫學文獻搜集相關資料的時間從幾周變為幾分鐘。由此產生的分析結果使醫生能夠針對任意患者特定的癌基因突變做出診斷。只需幾分鐘,Watson就能完成遺傳物質和醫學文獻的審查過程,產生一份可視化數據的報告,并以循證醫學為基礎,綜合患者個人獨特的基因提供可行的藥物方案。臨床醫生可以評估這些證據,以確定它的療效是否會比標準方案更有針對性。
前沿認知科學的含義和義務認知時代(The Cognitive Era)是應用型科學發展的下一步,它幫助人類理解自然并改善人類的生存狀況。在此意義下,它是一個老故事開啟新篇章。圍繞人工智能的爭論只是其中一個最新的例子,是相信科學進步的人和那些害怕它的人之間古老爭論的延續。與媒體和流行娛樂界的爭論相反,在科學領域,裁決已定。追求認知性未來已成為廣泛共識,人們也普遍認識有必要承擔技術責任。
「技術創造可能性和潛力,但最終,我們的未來將取決于我們做出的選擇。我命在我,不在技術。」
——Erik Brynjolfsson,MIT(麻省理工學院,經濟學著名教授)
具體而言,我們會繼續型塑認知計算對工作和就業的影響。與所有技術一樣,認知計算將改變人們的工作性質。這將有助于我們更快速、更準確地執行一些任務。許多處理過程會更便宜,更有效。某些事,它甚至會比人類做的更好。這也是自文明誕生以來一直發生的情況:新技術被發現具有更高的價值,它讓我們的社會和生活得以適應和進化。所以,我們有理由相信,此時此刻的情況與以往是一致的。事實上,認知時代會為人類開啟一個知識、發現、機會都以指數級速度增長的世界。我們也有充分的理由相信,人類的工作將變得越來越有趣,也更具有挑戰性和價值。
同時,社會的控制和保障也一樣重要。對于智能系統的擔憂再一次適用于此。從汽車、藥品到手機,每一項技術的轉換都會涉及個人和機構的安全問題。這些問題已經刻不容緩,也將繼續與認知技術發展如影隨形。這些問題已經被今天激進的技術民主化(網絡和云端的快速傳播是背后的驅動力)以及隨之而來的成本削減所點燃。
我們相信,答案不是試圖限制民主化,而是要擁抱它,同時設計出融合隱私、安全和人工控制的認知系統。
為下一代人類的認知鋪平道路最后,所有的技術革命不僅是被發現的,而且是由商業和社會需求推動的。我們追求這些新的可能性并不只是因為我們有能力,而是因為我們有所求。
每一項革命性的技術,由于世界的復雜性和我們自己根深蒂固的偏見和方法,我們最初對它們的理解都是有限的。然而,所有的限制必然會被進展所突破。事實上,我們一直在為不知道付出昂貴的代價:我們不知道患者的病因出在哪里;不知道產品的消費者在哪里;不知道重要的自然資源藏在在哪里;不知道每一項的投資風險在哪里。
「行為明智的最大障礙是無知,它也是恐懼的最大來源。小小的蠟燭會發出誤導性的微弱光線,投射出巨大而不詳的陰影。正午陽光光線明亮,不會投下一絲陰影。是時候將這整個人與機器的難題置于耀眼的正午陽光之下了。計算機永遠不會剝奪人的主動權,也不會取代人類的創造性思維。計算機會把人類從低級的重復性思考中解放出來,讓人類更加充分利用理性,創造更多機會。」
——Thomas Watson Jr. (小托馬斯.沃森,IBM第二代總裁)
在IBM,我們相信,世界上的許多難題終將得到解決。借助認知計算,我們會實現這一宏偉目標。
炒作「人機大戰」的戲碼會讓我們偏離主題,這些戲碼只存在于那些激動人心卻很具誤導性的小說里。現在的認知系統不是我們的競爭對手,將來也不會是。科學和經濟學的證據都不支持這種恐懼。真正的認知系統實際是一種深化重要關系的工具——人與世界的關系。
通過它們,我們將為下一代人的認知鋪平道路。我們能用嶄新而有力的方式思考和推理。認知系統是真正靈感源于人類大腦的機器。同樣的,這些機器也會真正激發人的大腦,提高我們的理性能力,改變我們的學習方式。在21世紀,知道所有的答案不能稱得上智慧,但提出更好的問題才算真正的天才。