由斯坦福大學發起的人工智能指數(AI Index)是一個追蹤 AI 動態和進展的非營利性項目,旨在全面研究 AI 行業狀況,旨在促進基于數據的 AI 廣泛交流和有效對話。
剛剛,AI Index 正式發布了 2021 年度報告。
報告下載地址:
https://aiindex.stanford.edu/report/
2021 AI Index 報告極大地擴展了可用數據量,并與大量外部組織合作校準數據、深化該報告與 Stanford HAI 的聯系。該報告還從多個方面展示了 COVID-19 對 AI 發展的影響。例如「技術表現」章節探討了 AI 初創公司如何利用機器學習技術加速 COVID 相關藥物研發;「經濟」章節表明 AI 招聘和私人投資并未受到新冠大流行的嚴重影響,仍處于增長態勢。
該報告從研發、技術表現、經濟、教育等多個維度探討了過去一年的 AI 發展,得出了如下重要結論:
對 AI 領域的私人投資額呈現顯著增長,其中「藥物、癌癥、分子學、藥物研發」獲得最大比例的投資——138 億美元,是 2019 年的 4.5 倍;
中國在學術工作方面的成績超過美國。多年前,中國的 AI 期刊發表文章數量即超過美國,現在中國首次在期刊引用量上也占據了優勢。不過在過去十年中,美國的 AI 會議論文(及高被引論文)數量仍超過中國;
合成媒體(deepfake)數量大增,文本、圖像、視頻合成方面都出現了突破。這顯示了 AI 的飛快發展,但也引發了人們對其濫用、誤用的潛在擔憂;
AI 應用的倫理挑戰引起 AI 社區的更多關注。2015-2020 年間涉及倫理及相關關鍵詞的論文數量增長迅速;
AI 領域面臨多樣性挑戰。2019 年,美國 45% 的 AI 博士新生是白人,僅有 2.5% 是非裔美國人,3.2% 是西班牙裔。目前,AI 研究者正在努力提升該領域的多樣性;
自 2017 年加拿大發布國家 AI 戰略后,多個國家采取了類似措施,截至 2020 年有 30 多個國家發布了國家 AI 戰略;
更多 AI 博士選擇進入工業界,而不是留在學術界,離開學界進入企業的教授數量也在持續增長;
企業主導了 AI 研究者的常用工具,如企業開發的軟件庫(谷歌的 TensorFlow 和 Keras、Facebook 的 PyTorch)成為 GitHub 上最熱門的框架;
政府對 AI 領域的興趣繼續增長,如美國政府斥資數十億美元投入 AI 的民用與非民用。美國國會提及「AI」的次數是上一屆國會的三倍;
監控技術呈現出快速、廉價的特點,得到越來越廣泛的使用。2020 年圖像分類、人臉識別、視頻分析、語音識別等技術取得顯著進展,用于大規模監控的技術快速成熟。
該報告共包括「研發」、「技術表現」、「經濟」、「AI 教育」、「AI 應用的倫理挑戰」、「AI 多樣性」、「AI 政策與國家戰略」七個部分。以下將介紹每個章節的核心內容。
第一章:研發
報告首先從「同行評審 AI 論文」、「AI 期刊論文」、「AI 會議論文」、「AI 專利」、「arXiv 論文」五個部分概述了 AI 領域的論文發表情況。
同行評審論文數量猛增
自 2000 至 2019 年,同行評審 AI 論文數量增長了約 12 倍,同期同行評審論文占所有論文發表量的比例從 2000 年的 0.82% 增長到 2019 年的 3.8%。
中國 AI 期刊論文被引量首超美國
就 AI 期刊論文而言,2020 年發表的 AI 期刊論文數量是 2000 年的 5.4 倍。其中,2020 年當年發表的 AI 期刊論文數量就比 2019 年增長了 34.5%,大大超過 2018 至 2019 年的漲幅(19.6%)。
2000-2020 年 AI 期刊論文發表數量。
其中,中國的 AI 期刊論文發表數量最多(占比 18.0%),超過美國(12.3%)和歐洲(8.6%)。這對于中國而言并非首次。
2000-2020 年不同地理區域的 AI 期刊論文發表數量占世界總量的比例。
值得一提的是,2020 年中國的 AI 期刊論文被引量首次超過美國。不過,在過去十年中,美國的 AI 會議論文引用量仍超過中國。
2000-2020 年 AI 期刊論文引用量的占比情況,中國以 20.7% 的比例首次超過美國(19.8%)。
AI 會議快速發展
過去十年,AI 會議論文數量呈迅猛增長態勢。2020 年,AI 會議論文數量占所有會議論文的比例已高達 20.2%。
2000-2020 年,AI 會議論文發表數量占所有會議論文的比例。
2019 年,中國的 AI 會議論文發表數量占比超過美國。然而,從 AI 會議論文被引用量來看,美國在過去 21 年中持續占據主導地位。2020 年,美國以 40.1% 的比例名列第一,中國則以 11.8% 的比例位居第二,二者差距仍然很大。
2000-2020 年不同地區的 AI 會議論文發表數量的占比情況。
2000-2020 年不同地區的 AI 會議論文被引用量的占比情況。
arXiv 論文發表情況
除了傳統的期刊和會議以外,預印本平臺的論文發表也很重要。過去 6 年中,arXiv 平臺上的 AI 相關論文增長了五倍多,從 2015 年的 5478 篇增長到 2020 年的 34,736 篇。其中中國的 arXiv 論文發表總數仍遜色于美國和歐洲,不過從占比情況來看,中國正在奮起直追。
2015-2020 年,不同地區在 arXiv 上發表 AI 論文數量的占比情況。
就 arXiv 上的六個 AI 細分領域而言,2015-2020 年間,機器人學 (cs.RO) 和機器學習 (cs.LG) 論文數量增長最快,分別增長了 11 倍和 10 倍。2020 年,機器學習與計算機視覺 (cs.CV) 占比最高,分別為 32.0% 和 31.7%。2019-2020 年,增長最快的類別是計算與語言 (cs.CL) 和機器人學 (cs.RO),論文數量分別增長了 35.4% 和 35.8%。
此外,得益于數據和算力的發展,深度學習論文數量飛速增長。
2010-2019 年,arXiv 平臺上深度學習論文的發表數量。
新冠疫情促使 AI 會議參會人數暴漲
由于新冠疫情的影響,大多數 AI 會議以線上的形式舉行,參會人數出現了很大增長。2020 年,該報告統計的九個會議的參數總人數幾乎翻了一番。
2010-2020 年,參加大小型 AI 會議的人數。
大公司參與度高,或加劇計算鴻溝
有研究表明,大型科技企業對 AI 頂會的參與度有所增加。研究者認為學術界算力的不均勻分布(即「計算鴻溝」)將加劇深度學習時代的不平等。大型科技企業擁有更多資源來設計 AI 產品,但其多樣化程度遜色于較小型的機構,而這引發了對 AI 偏見及公平性的擔憂。下圖展示了大企業在 10 個 AI 頂會中的參與度,這或許會加速計算鴻溝。
2000-2019 年,大型科技企業的 AI 會議論文數量占比情況。
TensorFlow 仍是最流行的 AI 軟件庫
除了論文、會議情況以外,該章節還介紹了 AI 開源軟件庫。其中谷歌開發的 TensorFlow 框架仍然是最流行的 AI 軟件庫,其次是 Keras 和 PyTorch。
2014-2020 年,AI 庫的流行程度(按照 GitHub 星數來計算)。
第二章:技術表現
本章概括了計算機視覺、語言、語音、概念學習、推理等多個 AI 子領域的技術進展。
AI 生成一切
目前,AI 系統可以合成高質量的文本、語音和圖像,甚至人類都很難辨別真偽。這將帶來大量 AI 下游應用,并促使研究者投入到生成模型檢測技術的研究中。下圖展示了過去兩年中生成模型的進展:
2018-2020 年生成模型在 STL-10 數據集上的 FID 得分。
2014-2020 年 GAN 人臉生成技術進步。
計算機視覺的產業化
計算機視覺在過去的十年里取得了巨大的進步,這主要歸功于機器學習技術(特別是深度學習)的應用。新的數據顯示,計算機視覺正在產業化:在一些最大的基準上,表現開始趨于平緩,這表明社會需要制定和商定更難的基準,以進一步獲得測試表現。
與此同時,企業正在投入越來越多的計算資源,比以往任何時候都以更快的速度訓練計算機視覺系統。同時,用于已部署系統的技術(如用于分析視頻靜止幀的目標檢測框架)正在迅速成熟,這表明將進一步部署 AI。
ImageNet 挑戰的 TOP-1 準確率變化。
COCO 密集姿態估計挑戰的平均精度變化。
NLP 評估指標
自然語言處理的迅速發展產生了 AI 系統,其語言能力顯著提高,已開始對世界產生有意義的經濟影響。谷歌和微軟都在他們的搜索引擎中部署了 BERT 語言模型,而從微軟到 OpenAI 等公司也開發了其他大型語言模型。
這一點可以從在 SuperGLUE 上獲得人類水平性能的系統的快速興起看出。SuperGLUE 是為響應早期 NLP 進展(超越 GLUE 評估的功能)而開發的 NLP 評估套件。
SuperGLUE 基準。
SQUAD 1.1 和 SQUAD 2.0 的 F1 SCORE 變化。
GPT-3 在 42 個基準上的表現。
AI 推理問題
大多數技術問題的度量都顯示了在固定的基準上,即每個時間點最佳系統的性能。針對 AI 指數開發的新分析提供了一些指標,這些指標考慮到了一個不斷發展的基準,并考慮到隨著時間的推移,將一組系統的總體性能的一部分歸因于單個信用系統。這些分析適用于兩個符號推理問題:自動定理證明和布爾公式的可滿足性。
2016-2020 年解決所有 400 個實例的總時間(布爾滿足問題)。
1997-2020 年解決的問題百分比(自動定理證明)。
機器學習變革醫療保健和生物學領域
機器學習正在改變醫療保健和生物學領域。DeepMind 的 AlphaFold 應用深度學習技術在數十年來的蛋白質折疊生物學挑戰中獲得重大突破。
2006-2020 年 CASP 最佳團隊在自由建模中的預測準確度。
科學家們用機器學習模型來學習化學分子的表示,以便制定更有效的化學合成計劃。AI 創業公司 PostEra 在疫情期間利用基于機器學習的技術加速推進與 COVID 相關的藥物發現。
PostEra:Moonshot 提交的藥物總數。
第三章:經濟
AI 的興起不可避免地提出了這樣一個問題:這些技術將在多大程度上影響企業、勞動力和更廣泛的經濟?AI 最近取得的進展和突破為企業提供了大量利益和機遇,從自動化提高生產率、使用算法為消費者定制產品到大規模分析數據等等。
然而,AI 帶來的效率和生產率的提高也包含巨大的挑戰:企業必須尋找和留住技能型人才以滿足其生產需求,同時要注意采取措施來降低使用 AI 的風險。此外,COVID-19 大流行給全球經濟帶來了混亂和持續的不確定性。私營企業是如何依賴和擴展 AI 技術來幫助企業渡過這一最困難的時期的?
AI 生物獲最多投資
藥物、癌癥、分子、藥物發現是 2020 年私人 AI 投資額最大的一個項目,超過 138 億美元,是 2019 年的 4.5 倍。
2019 年與 2020 年 AI 全球私人投資的領域分布。
AI 人才招聘仍在繼續增長
巴西、印度、加拿大、新加坡和南非是 2016 年至 2020 年 AI 招聘增長最快的國家。盡管出現了 COVID-19 大流行,但所有采樣國家 2020 年的 AI 雇傭人數仍在繼續增長。
2020 年 AI 招聘指數的國家分布情況。
2016-2020 年 AI 招聘指數在不同國家的變化。
AI 私人投資趨勢
越來越多的 AI 私人投資集中到少數的初創企業。盡管受到疫情影響,但 2020 年私人 AI 投資額較 2019 年增長了 9.3%,增幅高于 2019 年(5.7%),不過新成立的公司數量連續三年處于下降趨勢。
2015-2020 年全球新增 AI 公司數量。
2015-2020 年度 AI 基金公司的私人投資額。
AI 道德問題的受關注度
麥肯錫的一項調查顯示,盡管越來越多人呼吁解決 AI 使用相關的道德問題,但業界在解決這些問題的努力上非常少。例如,AI 的公平性等問題仍然受到很少公司的關注。此外,與 2019 年相比,2020 年將個人或個人隱私風險視為相關風險的公司較少。
2020 年機構認為與采用 AI 技術相關的風險比例。
2020 年機構采取措施以緩解 AI 帶來的風險比例。
AI 領域投資受疫情影響了嗎?
盡管疫情導致了經濟衰退,麥肯錫的一項調查中有一半的受訪者表示冠狀病毒對他們在 AI 領域的投資沒有影響,而實際上有 27% 的人表示他們的投資有所增加。不到四分之一的企業減少了對 AI 的投資。
疫情期間的 AI 投資變化。
美國的 AI 崗位比例有所下降
從 2019 年到 2020 年,美國的 AI 崗位比例有所下降,這是 6 年來的首次下降。在美國發布的 AI 崗位總數也下降了 8.2%,從 2019 年的 325724 個職位減少到 2020 年的 300999 個職位。
2013-2020 年按國家劃分的 AI 職位。
第四章:AI 教育
隨著 AI 成為經濟活動越來越重要的驅動力,越來越多的人想要了解它并獲得從事該領域工作的必要資格。同時,工業界對 AI 的需求不斷增長,吸引越來越多的教授離開教育界,進入私營企業。本章重點介紹 AI 人才變化趨勢。
世界頂尖大學加大對 AI 教育的投入
2020 年進行的一項 AI 指數調查顯示,過去四年中,世界頂尖大學加大了對人工智能教育的投入。在過去的四個學年里,在本科和研究生階段教學生構建或部署實用 AI 模型所需技能的課程數量分別增加了 102.9% 和 41.7%。
AI 博士畢業生選擇
計算機研究協會(CRA)的一項年度調查顯示,過去 10 年,北美更多的 AI 博士畢業生選擇在工業界工作,選擇學術界工作的較少。
具體而言,在過去十年中,選擇進入業界工作的 AI 博士比例增加了 48%,從 2010 年的 44.4% 增至 2019 年的 65.7%。相比之下,進入學術界的 AI 博士比例下降了 44%,從 2010 年的 42.1% 降至 2019 年的 23.7%。
AI 專業在 CS 博士中的比例
根據 CRA 的調查,在過去 10 年中,美國 AI 相關博士占 CS 博士學位總數的比例從 14.2% 上升到 2019 年的 23% 左右。與此同時,其他以前比較流行的計算機科學博士的受歡迎程度有所下降,包括網絡、軟件工程和編程語言。與 2010 年相比,編譯器專業獲得博士學位的人數有所減少,而 AI 和機器人 / 視覺專業的博士人數則大幅增加。
AI 教師轉行業界
在經歷了兩年的增長之后,北美地區從大學 AI 教職人員轉到業界發展的人數從 2018 年的 42 人下降至 2019 年的 33 人(其中 28 人是終身教職,5 人是非終身教職員工)。
2004 年至 2019 年間,卡內基梅隆大學的人工智能教師離職人數最多(16 人),其次是佐治亞理工學院(14 人)和華盛頓大學(12 人)。
AI 博士中的國際學生
2019 年,北美 AI 博士中的國際學生比例繼續上升,達到 64.3%,相比 2018 年增長 4.3%。在外國畢業生中,81.8% 的國際學生選擇留在美國,8.6% 的人選擇在美國以外的地方工作。
除此以外,在歐盟,絕大多數專業的 AI 學術課程是在碩士級別教授的;機器人技術和自動化是迄今為止本科生和碩士項目中最常教授的課程,而機器學習(ML)在專業短期課程中占主導地位。
第五章:AI 應用的倫理挑戰
隨著 AI 對人類生活的影響日益深刻,其所面對的倫理挑戰也越來越明顯。各種技術的應用可能會導致意想不到的負面影響,比如隱私侵犯;基于性別、種族 / 民族、性取向、性別身份的歧視;以及不透明決策等問題。打造負責任的、公平的 AI 創新,從來沒有像今天這樣重要。
報告的第五章首先介紹了近期頒布的大量 AI 原則和框架文件,以及與 AI 道德問題相關的媒體報道,然后回顧了在 AI 會議中提出的道德相關研究、全球各地大學計算機系開設的道德課程。此外,報告還討論了人臉識別技術偏見方面的研究。
學術會議中的道德 AI
如圖 5.3.1 所示,自 2015 年以來,向 AI 會議提交的論文里,標題含有倫理相關關鍵詞的數量大幅增加。
但近年來,在主流 AI 會議中與倫理相關關鍵詞匹配的論文標題的平均數量依然很低。圖 5.3.2 展示了六個主流會議所有出版物中倫理相關關鍵詞匹配的平均數量。
媒體報道中的道德 AI
如圖 5.2.1 所示,在 2020 年最受關注的新聞話題中,與 AI 道德指導及框架有關的文章名列榜首,隨后是研究與教育、人臉識別等。
2020 年,與 AI 道德應用相關的五大新聞最受關注:
歐盟委員會 (European Commission) 發布關于人工智能的白皮書(5.9%);
谷歌解雇道德研究人員 Timnit Gebru (3.5%);
聯合國成立人工智能道德委員會 (2.7%);
梵蒂岡的人工智能倫理規劃 (2.6%);
IBM 宣布退出人臉識別業務 (2.5%)。
第六章:AI 領域的多樣性
AI 領域的多樣性問題存在已久,當前 AI 研究者仍以男性為主,且在種族、民族、性別認同和性取向方面缺乏多樣性,學術界和行業界皆是如此。這加劇了 AI 系統現有的不平等。
報告的第六章介紹了 AI 人才和學術界的多樣性統計。鑒于該方面公開的數據較少,關于 AI 多樣性問題對社會及技術發展影響程度的統計、分析、評估都會受到限制。從學術界和產業界獲得更多的數據,對于衡量該問題的嚴重程度以及解決問題至關重要。
近年來,AI 博士畢業生和計算機科學終身教授的女性成員比例一直很低。根據計算機研究協會 (CRA) 的一項年度調查,北美 AI 博士項目的女性畢業生占所有博士畢業生的平均比例不足 18% 。
一項 AI 指數調查顯示,在世界各地大學的計算機系中,女性教師僅占全部終身制教師的 16% 。
此外,根據 CRA 的 Taulbee 調查,2019 年新增的美國居民 AI 博士生中,白人 (非西班牙裔) 所占比例最高(45.6%) ,其次是亞洲人 (22.4%),非洲裔美國人(非西班牙裔,2.4%)和西班牙裔(3.2%)占比很低。
第七章:AI 與國家戰略
未來幾十年,AI 將重塑全球競爭力格局,為早期實踐者帶來強大的經濟和戰略優勢。報告的第七章介紹了全球 AI 政策制定的概況,對當下各國家和地區的 AI 戰略進行了梳理。此外本章還介紹了美國對 AI 領域的公共投資,以及立法機構、中央銀行和非政府組織如何應對日益增長的 AI 技術政策框架需求。
自加拿大 2017 年發布了全球第一個國家級人工智能戰略以來,截至 2020 年 12 月,已有其他 30 多個國家和地區發布了類似文件。中國在 2017 年發布了《新一代人工智能發展規劃》,這是世界上最全面的人工智能發展戰略之一。
2019 年 2 月,白宮發布《美國人工智能倡議》,將聯邦政府 AI 研發的投資需求列為優先事項,確保 AI 技術的安全開發、測試和部署的技術標準。該倡議還強調要培養一支 AI 人才隊伍,并表示將致力于與國際伙伴合作,提升美國在 AI 領域的領導地位。然而,這項倡議缺乏項目時間線細節,目前尚不清楚是否會有更多致力于 AI 的研究或其他實際內容。
政府對 AI 的關注度依然高漲,美國政府在 AI 的民用和非民用方面投入了數十億美元。在本屆國會中,AI 的提及量是上一屆的三倍。
2019 年和 2020 年的綜合數據表明,創新與技術、國際事務和國際安全、工業和監管等主題是美國人工智能政策文件的主要關注點。
AI Index 聯合主席 Jack Clark 表示:「從數據中可以清楚地看到,2020 年人工智能對世界產生的影響更加重要,技術仍將以飛快的速度向前發展。」
「這份報告還向我們強調,政府需要投入更多的資金來收集有關 AI 的數據,研究者需要為新一代 AI 系統開發更難的測試。各種維度的文獻分析表明,在人工智能發展方面,美國和中國已經成為彼此對等的國家。」