人工智能(AI)已經成為當今時代的口號。
技術專家、學者、記者、風險投資家都在說這個詞。跟其他許多從技術或學術領域流入普通大眾的詞語一樣,“AI”這個詞的使用也存在嚴重的誤解。
然而,跟其他領域中公眾不理解科學家在做的事情不一樣,對于“AI”,科學家們經常和公眾一樣困惑。
某種程度上,我們這個時代正在看到一種與我們人類的智能相匹敵的硅基智能的出現,這既讓所有人感到興奮,讓我們著迷,同時也讓我們感到恐懼。不幸的是,它分散了我們的注意力。
我們急需發展構建推理和決策系統的原則
我們可以從另一個角度來講述這個時代。有這樣一個故事,其中涉及人類、計算機、數據和生死抉擇,但重點不僅僅是硅基智能這類的幻想。
14年前,我的妻子懷孕時,我們做了超聲波檢查。醫生是一位遺傳學家,她指出胎兒心臟周圍有一些白點。“這些都是唐氏綜合癥的標志,”她說,“現在你的風險已經上升到20分之一了。”她告訴我們,可以通過羊膜穿刺術了解胎兒是否真的有唐氏綜合癥基因畸變,但羊膜穿刺術存在風險——在穿刺術過程中胎兒死亡的幾率大約是300分之一。
作為一名統計學家,我決定找出這些數字的來源。在我的研究中,我發現十年前英國有人做過一項統計分析,這些反映鈣沉積的白點確實被認為是唐氏綜合癥的預測因子。我還注意到,我們做檢查時使用的成像機每平方英寸的像素比英國研究中使用的成像機多幾百個像素。我回去告訴遺傳學家,我相信那些白點很可能是假陽性,也就是字面上的白噪音。
她說:“啊,這就解釋了為什么我們幾年前開始發現唐氏綜合癥的診斷有上升趨勢。那恰好是新機器運來的時候。”
我們沒有做羊膜穿刺術,幾個月后妻子生下一個健康的女孩。但這件事一直讓我放不下,尤其是我知道由于一次粗略的計算,那天可能有成千上萬的人得到同樣診斷,然后許多人選擇做羊膜穿刺術,造成許多嬰兒不必要的死亡。
這件事揭示的問題不是我個人的醫療問題;它關乎一個醫療系統,在不同的地點和時間測量變量和結果,進行統計分析,并在其他情況下使用結果。
這個問題不僅與數據分析本身有關,而且與數據庫研究人員所稱的“溯源”(provenance)有關——數據來自哪里,從數據中得出了什么推論,這些推論與當前的情況有多大關系?雖然專業人士可能在遇到個案時能逐步解決這些問題,但問題是設計一個行星級規模的醫療系統,該系統要能在不需要如此詳細的人類監督的情況下做到這一點。
我也是一名計算機科學家,我突然想到,在我所受的教育中,根本找不到構建這種行星級規模的推理和決策系統所需要的原則,這些原則融合了計算機科學和統計學,并考慮到人類的效用。在我看來,發展這些原則至少與構建玩游戲之類眼花繚亂的AI系統同樣重要,這些原則不僅在醫學領域,而且在商業、交通和教育等領域都需要。
一個新的工程學分支:將人類和計算機結合起來
無論我們是否很快就能理解“智能”,我們都面臨著一項重大挑戰,那就是如何將計算機和人類結合起來,從而增強人類的生活。
盡管一些人認為這一挑戰只是AI創造的一種輔助,但另一種觀點認為,這是一個新的工程學分支。就像過去幾十年的土木工程和化學工程一樣,這門新學科的目標是圍繞一些關鍵思想,為人們帶來新的資源和能力,并確保安全。土木工程和化學工程建立在物理和化學的基礎上,而這門新的工程學科將建立在上個世紀賦予了實質的思想之上,如信息、算法、數據、不確定性、計算、推理和優化。此外,由于新學科的大部分重點將放在來自人類和關于人類的數據上,因此,它的發展將需要社會科學和人文學科的觀點。
雖然各種構建塊已經就位,但是將它們組合在一起的原則還沒有到位,因此目前將這些塊組合在一起的方式是臨時的。因此,就像人類在土木工程出現之前建造建筑物和橋梁一樣,人類也在繼續建造涉及機器、人類和環境的社會規模的推理和決策系統。正如早期的建筑和橋梁有時會以無法預見的方式倒塌,并帶來悲劇性的后果一樣,我們早期的許多社會規模的推理和決策系統已經暴露出嚴重的概念缺陷。
不幸的是,我們并不擅長預測下一個可能出現的嚴重缺陷是什么。我們缺少的是一個分析和設計原則的工程學科。
目前大多數AI,實際上是機器學習
目前關于這些問題的公開討論中,經常使用“AI”這個術語作為一個智能的通用詞,這使得人們很難推斷出新興技術的范圍和后果。因此,我們有必要深入了解AI在最近和曾經被用來指代什么。
如今大多數被稱為AI的東西,尤其是在公共領域,實際上是機器學習(ML),這個術語在過去幾十年里一直在使用。ML是一個算法領域,融合了統計學、計算機科學和許多其他學科的思想(見下文),設計處理數據、做出預測和幫助做出決策的算法。
就對現實世界的影響而言,ML是真實存在的,而不僅是最近才火起來的。事實上,在20世紀90年代初期,ML就已展現出將為產業界帶來巨大改變的苗頭。到了世紀之交,亞馬遜等具有前瞻性的公司就已經在他們的業務中使用機器學習、解決關鍵任務、后端欺詐檢測和供應鏈預測中存在的問題,以及建立面向消費者的創新服務,如推薦系統。
在隨后的20年里,隨著數據集和計算資源的迅速增長,很明顯,ML很快將不僅為亞馬遜提供動力,而且將為任何一家可以將決策與大規模數據關聯在一起的公司提供動力。新的商業模式將會出現。
“數據科學”一詞用來指代這種現象,反映了ML算法專家與數據庫和分布式系統專家合作構建可擴展、強大的ML系統的需要,也反映了這樣的系統將產生更大范圍的社會影響。過去幾年,這種思想和技術趨勢的融合被重新命名為“人工智能”。這種品牌重塑的做法值得仔細審查。
模仿人類的AI和智能增強
從歷史上看,“人工智能”一詞是在20世紀50年代末創造的,指的是在軟件和硬件上實現具有人類智能水平的實體這樣一個令人興奮的愿望。我將用“模仿人類的AI”(human-imitative AI)來指代這一愿望,強調人工智能實體似乎應該成為我們人類的一員,即使不是在身體上成為,那么至少在精神上要這樣(無論這可能意味著什么)。
這在很大程度上是一項學術事業。雖然相關的學術領域,如運籌學、統計學、模式識別、信息論和控制理論已經存在,并且經常從人類或動物的行為中獲得靈感,但這些領域可以說是專注于低水平的信號和決策。
比如,松鼠能夠感知它所居住的森林的三維結構,并能在樹枝間跳躍,這種能力對這些領域具有啟發意義。AI旨在關注一些不同的東西:人類進行推理和思考的高級或認知能力。然而,60年后,高層次的推理和思想仍然難以捉摸。現在被稱為AI的發展主要出現在與低水平模式識別和運動控制相關的工程領域,以及統計學領域,該學科的重點是在數據中發現模式,并做出有充分根據的預測、測試假設,以及決策。
事實上,現在被認為是所謂“AI革命”核心的著名的反向傳播算法,是David Rumelhart在20世紀80年代初重新發現的,而它早在20世紀60年代和60年代的控制理論領域就已出現。其早期應用之一是優化阿波羅飛船飛向月球時的推力。
自上世紀60年代以來,AI已經取得了很大的進步,但可以說,這種進步并非源于對模仿人類的AI的追求。相反,就像阿波羅飛船的例子一樣,這些想法往往隱藏在幕后,研究人員的工作專注于特定的工程挑戰。雖然普通大眾看不到,但在文檔檢索、文本分類、欺詐檢測、推薦系統、個性化搜索、社會網絡分析、規劃、診斷和A / B測試等領域的研究和系統構建取得了重大進展,這些進步推動了谷歌、Netflix、 Facebook和亞馬遜等公司的成功。
人們可以簡單地把這一切稱為AI,事實上,這似乎已經發生。對于那些發現自己突然被稱為AI研究人員的優化或統計學研究人員來說,這樣的標簽可能會讓他們感到意外。但撇開標簽不談,更大的問題是,使用這個單一的、定義不清的首字母縮略詞,阻礙了他們對正在發揮作用的智能和商業問題范圍的清晰理解。
在過去的20年里,工業和學術領域都取得了重大進展——作為模仿人類的AI的補充,通常被稱為“智能增強”(Intelligence Augmentation, IA)。在這里,計算和數據被用來創建增強人類智力和創造力的服務。搜索引擎可以被視為IA的一個例子,因為它可以增強人類的記憶和事實知識;自然語言翻譯也是IA的一個例子,它可以增強人類的溝通能力。基于計算機的聲音和圖像生成為藝術家提供了增強調色和創造的能力。雖然這類服務將來可能包含高層次的推理和思考,但目前還沒有;它們主要執行各種字符串匹配和數值操作,以捕獲人類可以使用的模式。
讓我們廣泛構思一個“智能基礎設施”的學科,構建基于計算,數據和物理實體的網絡,使人類環境更加有趣和安全。目前這種基礎設施已經開始在運輸,醫藥,商業和金融等領域出現,對個人和社會的影響正越來越深。
可以想象,我們生活在一個覆蓋全社會的醫療系統中,這個系統能夠建立人與醫生、醫療設備之間的數據流和分析,幫助醫生做出更準確地診斷,并提供護理服務。系統可以整合來自體細胞、DNA、血液測試,環境,群體遺傳學以及關于藥物和治療的大量科學文獻的信息。它不僅關注單個患者和醫生,而且關注所有人類之間的關系,有助于維持關于醫療信息的相關性、來源和可靠性的概念,就像今天的銀行系統關注金融和支付領域的挑戰一樣。盡管人們可以預見這樣的系統中會出現許多問題,比如隱私問題、責任問題,安全問題等等。但我們應該將這些問題視作勇于面對的挑戰,而不是前進的阻礙。
目前的AI成果解決不了核心問題
現在我們面臨一個關鍵問題:目前在傳統的、基于人類模仿的AI真的是解決這些挑戰的最佳方式(甚至是唯一方式)嗎?
事實上,機器學習近年來取得成功的一些成功案例都是在模仿人類的AI領域,如計算機視覺、語音識別、游戲和機器人技術。也許我們應該繼續等待,等待這些領域的更多技術進步。這里有兩件事情需要注意。
首先,目前模仿人類的AI取得的成功還很有限,我們的最終愿望還遠未實現。同時,在這個領域已經取得的有限進展,產生了巨大的快感,也滋生了不少恐懼,導致AI的過度繁榮和媒體的過度關注,這一點在其他工程領域是不存在的。
更重要的是第二點,在這些領域取得的成功并不足以解決重要的IA和II問題。比如自動駕駛汽車。要實現自動駕駛,需要解決一系列工程上的問題,這些問題可能與人的能力(或人力資源缺乏)關系不大。整體交通運輸系統(II系統)可能更接近當前的空中交通管制系統,而不是目前普遍關注的人類駕駛員。這種系統比現有的空中交通管制系統復雜得多,特別是可以使用大量數據和自適應統計建模,為精細化決策提供信息。應對這些挑戰需要關注最前沿,僅僅關注模仿人類的AI是不夠的。
至于必要性,有人說模仿人類的AI愿景涵蓋了IA和II的目標,因為它不僅能夠解決AI的經典問題(比如圖靈測試),同時也是解決IA和II問題的最佳選擇。不過這種說法幾乎在歷史上找不到先例。以前聽說過要用AI木匠或AI瓦工來搞土木工程嗎?化學工程是否應該建一個AI化學家的框架?更有爭議的是:如果我們的目標是建立化工廠,是否應該首先打造一群AI化學家,然后讓TA們去研究怎么建?
有一種說法是,人類智能是我們所了解的唯一一種智能,因此我們應該將模仿人類智能作為第一步。但是,人類實際上并不擅長某種推理,人類有自己的失誤、偏見和局限。而且,至關重要的是,人類并沒能進化足以執行現代II系統必須面對的大規模決策,也沒有應對II環境中出現的各種不確定性的能力。
有人可能會說,人工智能系統不僅會模仿人類智能,還會糾正人工智能,而且這種能力可以擴展到任意規模的問題。當然,現在說的處于科幻小說的范疇,這種推測性的論點,雖然放在科幻小說中會很吸引人,但不應該成為我們面對關鍵的IA和II問題時采取的主要戰略,這類問題已經開始出現了。我們需要根據自身的優勢解決IA和II問題,而不僅僅靠模仿人類的AI。
當然,經典的人工模擬AI問題仍然很有意義。然而,目前的重點是通過收集數據進行AI研究,部署深度學習基礎設施,以及模仿某些特定人類技能的系統的演示。這些研究中幾乎沒有涉及新的解釋性原則,往往會將研究的注意力偏離經典AI領域的幾個主要開放問題。
這些問題包括需要將意義和推理引入自然語言處理的系統,以應對推斷和表示因果關系的需要。開發計算易處理的不確定性表示,以及開發制定和追求長期目標的系統。這些都是模仿人類的AI的經典目標,但在當前人工智能革命的熱潮中,人們很容易忘記這些尚未解決的問題。
IA同樣是非常重要的問題,因為在可預見的未來,計算機仍無法與人類在抽象推理真實情況的能力相比。我們需要經過深思熟慮的人機的交互來解決最緊迫的問題。我們希望計算機能夠催生出人類創造力的新水平,而不是取代人類的創造力。
目前的AI視野過于狹隘,談AI革命為時尚早
最早提出“人工智能”這個名詞的是約翰·麥卡錫(時任達特茅斯大學教授,后來去了麻省理工學院),當時他提出這個名詞,應該是為了區分他剛剛起步的研究項目和諾伯特·維納的項目(當時是MIT的老教授)。維納提出了“控制論”一詞來指代他自己對智能系統的展望,這一概念與運營研究、統計學、模式識別、信息理論和控制理論密切相關。而麥卡錫則強調了與邏輯的聯系。有趣的是,今天占據主導地位的更多是維納的關于“智能”的內容體系,但外表卻用的是麥卡錫提出來的“人工智能”一詞。
除了歷史上的觀點差異之外,我們還要認識到,目前關于人工智能的公共對話,多數僅限于產業界和學術界的很小一部分,這種狹隘視野會影響我們面對人工智能所帶來的全部挑戰和機遇。
這里說的廣闊視野,和實現科幻小說中的場景關系不大,更多與人類對技術的必要性的理解和塑造有關,因為它在日常生活中變得越來越有影響力。在這種理解和塑造中,需要來自各行各業的各種各樣的聲音,而不僅僅是技術上對話。僅僅關注模仿人類的AI,可能會讓我們無法獲知,或不愿去獲知更廣泛的信息。
學術界也要發揮重要作用,不僅僅是提供一些最具創新性的技術理念,而且會與計算、統計學等學科的研究人員共同作出貢獻,這些貢獻和觀點非常重要,尤其需要社會科學、認知科學和人文科學的觀點。
另一方面,雖然科學對人類的前進必不可少,但我們也不應該夸大我們的努力和成果。社會的目標是建立新的成果。應該構建這些工件以按照聲明的方式工作。我們不希望造出一提供醫療、交通選擇和商業機會的系統,然后發現這些系統無法真正發揮作用,發現它們會產生錯誤,影響到我們的快樂和生活。所以,正如我所強調的那樣,目前在數據和學習為關注重點的領域還沒能出現一個“工程學科”。盡管這些領域的發展前景令人興奮,但目前還不能被視為“工程學科”。
我們應該接受這樣一個事實,即我們正在見證一個新的工程學科的誕生。“工程”這個詞具有獨特的內涵,容易讓人想到冷漠、情感的機器,以及失去對人類的控制,但我們可以打造自己想要的工程學科。在當今時代,我們迎來了一個真正的機會,來構思歷史上前所未有的新東西:以人為本的新興工程學科。我在這里不打算這個新興學科取名,但如果縮略詞“AI”繼續作為學科名字使用,那么我們需要意識到這個詞的真正意義和局限性。我們需要拓寬視野,平息炒作,并對未來的嚴峻挑戰有一個清醒的認識。