雖然該領(lǐng)域跨越多個(gè)行業(yè),并且可以從不同的角度來看,例如教學(xué),研究,工業(yè)和媒體,但這些視角之間的詞匯似乎沒有什么重疊。工業(yè)傾向于強(qiáng)調(diào)算法,可能有效地獲得時(shí)間和人力。人工智能的社會(huì)相關(guān)性日益增加以及越來越多地使用算法引發(fā)的潛在道德問題反映了媒體中應(yīng)用和道德主題的可見性,這使得AI對(duì)公眾更加迫切和直觀。有趣的是,道德關(guān)鍵詞在教學(xué)中的代表性也更高,可能是由于公眾利益和政府的一些授權(quán),如在荷蘭。在人工智能研究中,道德關(guān)鍵詞目前尚未明確可見,這就提出了一個(gè)問題:人工智能研究人員是否會(huì)進(jìn)行道德分析,這些討論是否在人工智能領(lǐng)域之外進(jìn)行,或者是否完全在研究之外進(jìn)行。這一觀察值得注意,因?yàn)槿斯ぶ悄苤胸?fù)責(zé)任的創(chuàng)新對(duì)于確保所有人的安全和公平結(jié)果至關(guān)重要。
人工智能也成為國家競(jìng)爭(zhēng)力的一個(gè)重要領(lǐng)域。近年來,隨著人工智能研究生態(tài)系統(tǒng)的不斷發(fā)展,一些國家和國際上的人工智能政策和策略相繼出臺(tái)。這通過各種傳播方式,包括出版物、預(yù)印本、會(huì)議、競(jìng)賽和軟件,增加了科學(xué)產(chǎn)出。
人工智能活動(dòng)存在很大的區(qū)域差異。中國渴望在全球范圍內(nèi)引領(lǐng)人工智能,并得到雄心勃勃的國家政策的支持。中國人工智能研究人員的凈人才增長也表明了一個(gè)有吸引力的研究環(huán)境。中國的人工智能專注于計(jì)算機(jī)視覺,沒有專門的自然語言處理和知識(shí)表示集群,包括語音識(shí)別,這可能是因?yàn)樵谥袊@類研究是由企業(yè)進(jìn)行的,它們可能不會(huì)發(fā)表那么多科學(xué)文章。中國的人工智能研究增長快速但仍然相對(duì)較低的引用影響,這可能是區(qū)域(而非全球)影響的一個(gè)癥狀。這一點(diǎn)也很明顯,因?yàn)閲H合作水平相對(duì)較低,研究的流動(dòng)性也相對(duì)較低,產(chǎn)生的人工智能研究語料庫相對(duì)較小,但被高度引用。與許多其他研究領(lǐng)域一樣,合作是成功的關(guān)鍵,這一點(diǎn)在全球社交媒體上的討論越來越多,國際人工智能競(jìng)賽的數(shù)量也越來越多。
歐洲在本報(bào)告中被定義為歐盟44個(gè)國家和有資格獲得Horizo??n 2020資金的相關(guān)國家。它是人工智能學(xué)術(shù)產(chǎn)出的最大區(qū)域,在歐洲以外的國際合作水平較高且不斷提高,但似乎正在失去學(xué)術(shù)人工智能,特別是近年來。歐洲廣泛的人工智能研究反映了歐洲國家的多樣性,每個(gè)國家都有自己的議程和專業(yè)。歐洲AI研究的重點(diǎn)領(lǐng)域包括用于模式識(shí)別,模糊系統(tǒng)以及語音和人臉識(shí)別的遺傳編程。與其他地區(qū)相比,歐洲的深度學(xué)習(xí)研究似乎與其他子領(lǐng)域的聯(lián)系較少,歐洲的AI機(jī)器人似乎嵌入在機(jī)器學(xué)習(xí)集群中。
美國企業(yè)部門吸引人才,并且在人工智能研究方面表現(xiàn)強(qiáng)勁,這可能是由于他們的跨部門聯(lián)合實(shí)驗(yàn)室傳統(tǒng)。在學(xué)術(shù)產(chǎn)出和人才保留方面,美國學(xué)術(shù)界也很強(qiáng)大。該國似乎在國際人工智能競(jìng)賽中處于領(lǐng)先地位,美國研究人員越來越多地在國際人工智能研究方面進(jìn)行合作。美國的AI專注于特定的算法,并將語音和圖像識(shí)別分成不同的聚類。該語料庫顯示的人工智能研究多樣性低于歐洲,但高于中國。
在人工智能的其他主要貢獻(xiàn)者中,我們注意到印度的迅速崛起,按人工智能出版物計(jì)算,印度目前是僅次于中國和美國的第三大國家。伊朗在2017年的出版物產(chǎn)出中排名第九,與法國和加拿大等國持平。去年,俄羅斯的科研產(chǎn)出超過了新加坡和荷蘭,但仍落后于土耳其。德國和日本仍然是全球第五大和第六大人工智能研究產(chǎn)出國。
人工智能研究的全球趨勢(shì)
計(jì)算經(jīng)同行評(píng)審的出版物是對(duì)研究成果的一種常見且易于理解的衡量標(biāo)準(zhǔn)。本報(bào)告旨在全面了解Scopus索引的所有類型的學(xué)術(shù)輸出,即期刊文章、會(huì)議論文和其他,如評(píng)論或調(diào)查論文。以下分析基于Scopus(2018年5月)1998年至2017年60多萬份人工智能出版物的精細(xì)化語料庫。此外,我們還研究了了預(yù)印本,會(huì)議和競(jìng)賽。
目前每年約有6萬篇論文發(fā)表。在全球范圍內(nèi),人工智能領(lǐng)域在過去5年里實(shí)現(xiàn)了12.9%的強(qiáng)勁增長。文學(xué)作品中有許多人工智能的歷史時(shí)間線,突出了該領(lǐng)域60年歷程中的關(guān)鍵事件和發(fā)現(xiàn),包括“人工智能寒冬”,被理解為對(duì)該技術(shù)的幻滅期。例如,從2005年開始,神經(jīng)網(wǎng)絡(luò)的研究開始在視覺和演講比賽中獲勝,到2009年,在一些基準(zhǔn)測(cè)試中處于主導(dǎo)地位。2014-2015年前后,出現(xiàn)了多篇關(guān)于深度學(xué)習(xí)的優(yōu)秀綜述(調(diào)查)論文。
人工智能領(lǐng)域的發(fā)展可以看作是分四個(gè)階段發(fā)生的,每個(gè)階段五年,新經(jīng)濟(jì)和互聯(lián)網(wǎng)大約在2000年左右出現(xiàn),同時(shí)出現(xiàn)的還有今天的幾家企業(yè),比如亞馬遜(Amazon)或谷歌。智庫歐亞集團(tuán)(Eurasia Group)和Sinovation Ventures以及李開復(fù)確定了人工智能的四個(gè)領(lǐng)域:互聯(lián)網(wǎng)人工智能(推薦系統(tǒng))、商業(yè)人工智能(欺詐檢測(cè)、財(cái)務(wù)預(yù)測(cè))、感知人工智能(智能設(shè)備)和自主人工智能(自動(dòng)駕駛汽車等新型硬件應(yīng)用)。
計(jì)算機(jī)視覺、神經(jīng)網(wǎng)絡(luò)和機(jī)器學(xué)習(xí)系統(tǒng)的AI一般能力研究的增長,在共同發(fā)生集群的出版物(例如,文章和會(huì)議論文)的增長中也是顯而易見的,如圖3.2所示。這些研究領(lǐng)域似乎解釋了2012年之后出版物的急劇增長。從人工智能生態(tài)系統(tǒng)開始,我們看到圖形處理單元(GPU)的興起以及2012年ImageNet的推出,這是一個(gè)大型的開放式數(shù)據(jù)庫,它可能有助于推動(dòng)這一發(fā)展。
集群出版物數(shù)量的歷時(shí)發(fā)展并未顯示文章和會(huì)議論文之間的巨大差異。雖然“計(jì)算機(jī)視覺”領(lǐng)域似乎受益于“機(jī)器學(xué)習(xí)和概率推理”和“神經(jīng)網(wǎng)絡(luò)”的發(fā)展,但“自然語言處理和知識(shí)表示”和其他能力受到的影響較小。
在arXiv語料庫增長的背景下,12個(gè)核心人工智能學(xué)科領(lǐng)域的預(yù)印本占整個(gè)arXiv預(yù)印本數(shù)量的比例顯著增長。1998年,這12個(gè)類別總共只占149個(gè)預(yù)印本,占提交到arXiv存儲(chǔ)庫的所有預(yù)印本的0.62%。1998年至2014年,這一比例逐漸上升,2015年開始大幅上升;2017年,這12個(gè)類別的預(yù)印本占提交給arXiv的所有預(yù)印本的12%以上。
查看12個(gè)核心AI主題類別提交的arXiv預(yù)印本,我們?cè)噲D發(fā)現(xiàn)提交模式的變化。隨著時(shí)間的推移,人工智能研究人員是否會(huì)根據(jù)每個(gè)學(xué)科類別提交的預(yù)印本數(shù)量,專注于不同類型的人工智能研究?圖3.3描述了隨著時(shí)間每個(gè)類別提交預(yù)印本的比例。
對(duì)12個(gè)核心人工智能主題領(lǐng)域中任意一個(gè)的arXiv預(yù)印本的分析顯示,與這些主題相關(guān)的內(nèi)容顯著增長,甚至與arXiv本身的增長相關(guān)。2017年,與核心人工智能概念相關(guān)的主題領(lǐng)域的預(yù)印本占全部arXiv內(nèi)容的11.6%,到目前為止,占到2018年提交內(nèi)容的15.1%——與幾年前(2015年為5.61%)相比,這是一個(gè)巨大的變化。這種增長可能是由于核心人工智能領(lǐng)域的關(guān)注、資金和研究的增加,但這也可能表明arXiv作為這些領(lǐng)域重要和可信的研究傳播工具的崛起,因?yàn)橄窆雀鐳eepMind這樣的大型人工智能研究實(shí)驗(yàn)室采用了這個(gè)平臺(tái)。
在過去的20年里,研究重點(diǎn)可能已在核心人工智能領(lǐng)域內(nèi)轉(zhuǎn)移。更傳統(tǒng)的是,計(jì)算語言學(xué)和自然語言處理研究在1998年主導(dǎo)了這些學(xué)科領(lǐng)域的arXiv提交(在所有12個(gè)類別中提交的149篇論文中有112篇,或75.2%)。雖然該領(lǐng)域仍然是人工智能研究領(lǐng)域的一個(gè)因素,但arXiv數(shù)據(jù)也表明計(jì)算機(jī)視覺和模式識(shí)別領(lǐng)域的顯著增長(從1998年核心AI提交的1.3%到2018年的32.7%,以及機(jī)器學(xué)習(xí)也增長明顯(1998年為1.3%,2018年為17.8%) - 這些領(lǐng)域都集中在深度學(xué)習(xí)應(yīng)用技術(shù)。
此外,像arXiv這樣的平臺(tái)似乎通過允許研究人員添加新的和更精確的主題區(qū)域名稱,來增加具體性,例如,區(qū)分機(jī)器學(xué)習(xí)中的統(tǒng)計(jì)學(xué)和計(jì)算機(jī)科學(xué)研究(始于2007年,2018年為10.8%)或添加主題類別(“計(jì)算機(jī)科學(xué) - 聲音”在2004年增加,“音頻和語音處理”和“圖像和視頻處理”都在2017年添加)。
arXiv預(yù)印本和Scopus出版物分析都根據(jù)平臺(tái)研究人員關(guān)注的領(lǐng)域,展示了AI領(lǐng)域的發(fā)展。雖然像“人工智能”這樣更通用的術(shù)語在arXiv上的提交率會(huì)隨著時(shí)間的推移而下降,但它們實(shí)際上是作為保護(hù)傘術(shù)語出現(xiàn)的。
人工智能的區(qū)域研究趨勢(shì)——中國的崛起
如圖3.4所示,歐洲仍然是人工智能研究的最大貢獻(xiàn)者,但其發(fā)表份額持續(xù)下降。美國正在收復(fù)過去五年失去的失地。中國在2004年就已經(jīng)超過了美國,在不久的將來,中國人工智能的出版產(chǎn)出肯定會(huì)超過歐洲。
圖3.5顯示其他個(gè)別國家在人工智能方面表現(xiàn)出強(qiáng)勁的發(fā)展。例如,印度在過去五年中成為人工智能研究的第三大國家。其他新興國家,如伊朗,也是人工智能研究的十大國家之一。像日本這樣的成熟研究國家在人工智能出版物產(chǎn)量方面也在增長,但其活力卻低于美國或中國。
人工智能在應(yīng)用領(lǐng)域的成功,如健康科學(xué)、移動(dòng)性或農(nóng)業(yè),促進(jìn)了人工智能研究的興趣和增長。本報(bào)告研究人工智能研究領(lǐng)域和集群中區(qū)域的專業(yè)化,并揭示了歐洲和美國醫(yī)學(xué)中AI應(yīng)用的重點(diǎn)。
近60%的人工智能研究出版物屬于自然科學(xué),其增長速度也最快。其他領(lǐng)域,如農(nóng)業(yè)科學(xué),也表現(xiàn)出強(qiáng)勁增長,但基數(shù)較小(約2%)。圖3.6顯示了中國在農(nóng)業(yè)科學(xué)中對(duì)人工智能很強(qiáng)的專業(yè)性,以及美國對(duì)醫(yī)學(xué)和健康科學(xué)的關(guān)注。歐洲和美國明顯強(qiáng)調(diào)人文科學(xué),反映出出版物數(shù)量非常少,可能會(huì)受到語言的影響。
關(guān)鍵詞共現(xiàn)的比較說明了每個(gè)地區(qū)的AI研究是如何專業(yè)化的,有助于識(shí)別共同的興趣和差異,例如共享的“模糊系統(tǒng)”群集,但是在“神經(jīng)網(wǎng)絡(luò)”一詞下不同類型的研究有不同的集群。
由于出版物總量較低,美國的集群結(jié)構(gòu)較薄。與中國和歐洲受業(yè)界影響較大的集群“模糊系統(tǒng)”和“計(jì)算機(jī)視覺”相比,這一領(lǐng)域的差異較小。中國與歐洲和美國最明顯的區(qū)別是缺乏“自然語言處理和知識(shí)表示”集群。這可能是由于中國在該領(lǐng)域的出版量較低,因?yàn)樵撝黝}的研究可能是由當(dāng)?shù)毓?其發(fā)表的論文少于大學(xué))推動(dòng)的。在中國出版物中,“神經(jīng)網(wǎng)絡(luò)”集群顯得非常不同,包括預(yù)測(cè)模型和反向傳播,以及機(jī)器人技術(shù)。在歐洲和美國,機(jī)器人技術(shù)是“機(jī)器學(xué)習(xí)和概率推理”集群的一部分。在中國和歐洲,我們針對(duì)“模式識(shí)別”等主題確定了“遺傳規(guī)劃”和“進(jìn)化算法”的其他集群。通過分析每年的出版物和每個(gè)地區(qū)的共現(xiàn)集群,可以獲得有關(guān)區(qū)域?qū)I(yè)化的更多詳細(xì)信息。
中國明顯關(guān)注“計(jì)算機(jī)視覺”領(lǐng)域,近期增長非常迅速,并且其“模糊系統(tǒng)”的研究趨于平緩,這推動(dòng)了中國在頭十年的出版增長。 “機(jī)器學(xué)習(xí)和概率推理”以及“搜索和優(yōu)化”會(huì)影響所有子域,但“計(jì)算機(jī)視覺”尤其受益于這些領(lǐng)域的發(fā)展。 2009年的峰值是由于當(dāng)時(shí)工程領(lǐng)域的會(huì)議的大力擴(kuò)張。隨著神經(jīng)網(wǎng)絡(luò)的興起,中國似乎從工程領(lǐng)域的研究主題,如“模糊系統(tǒng)”,轉(zhuǎn)向了其他領(lǐng)域。
歐洲和美國顯示出類似的集群模式,“規(guī)劃和決策”和“計(jì)算機(jī)視覺”領(lǐng)域強(qiáng)烈推動(dòng)了AI領(lǐng)域。來自歐洲的出版物更多地關(guān)注“規(guī)劃和決策”而不是“計(jì)算機(jī)視覺”。“神經(jīng)網(wǎng)絡(luò)”研究在期刊文章方面迅速增長,但在所有地區(qū)的會(huì)議論文中則較少,而“自然語言處理和知識(shí)表示”的研究表明,各區(qū)域的會(huì)議論文增長強(qiáng)勁。
除了語言的影響外,中美人工智能研究專業(yè)化的差異也可能源于不同的優(yōu)先級(jí);在中國,我們看到人工智能研究的重點(diǎn)是農(nóng)業(yè),而美國是健康問題。 “規(guī)劃和決策制定”適用于自動(dòng)駕駛系統(tǒng),強(qiáng)化學(xué)習(xí),機(jī)器人,人機(jī)界面,計(jì)算機(jī)游戲和電影,物流和移動(dòng)網(wǎng)絡(luò)。一個(gè)可能的解釋可以在歐洲和美國悠久的工業(yè)傳統(tǒng)中找到。
AI會(huì)議一覽
重要的人工智能會(huì)議,特別是他們對(duì)論文的呼吁,給出了當(dāng)前人工智能研究趨勢(shì)的早期跡象。圖3.11的關(guān)鍵詞是從斯坦福AI指數(shù)推薦的2018年十大人工智能會(huì)議論文征集中手動(dòng)提取的。對(duì)“學(xué)習(xí)”和“機(jī)器學(xué)習(xí)系統(tǒng)”的關(guān)注仍在繼續(xù),但我們也看到了對(duì)多主題的濃厚興趣。
如圖3.12所示,AI會(huì)議環(huán)境很復(fù)雜:會(huì)議在子域之間重疊,核心AI與數(shù)據(jù)挖掘領(lǐng)域之間有很強(qiáng)的聯(lián)系。人工智能會(huì)議還涉及相關(guān)領(lǐng)域,如數(shù)學(xué),統(tǒng)計(jì)學(xué),腦科學(xué),機(jī)器人學(xué),計(jì)算機(jī)圖形學(xué),語言學(xué),認(rèn)知科學(xué),社會(huì)科學(xué),生物信息學(xué),計(jì)算機(jī)系統(tǒng)或高性能計(jì)算。同樣,傳統(tǒng)的象征性人工智能會(huì)議使用“人工智能”一詞,而較新的人工智能會(huì)議使用機(jī)器學(xué)習(xí)和概率推理等術(shù)語,并/或與更獨(dú)立的應(yīng)用程序會(huì)議相連接。
我們使用數(shù)字書目和圖書館計(jì)劃(DBLP)計(jì)算機(jī)科學(xué)書目網(wǎng)站的數(shù)據(jù),深入探討人工智能會(huì)議的歷時(shí)和區(qū)域趨勢(shì)。
看一下非常狹窄的AI相關(guān)會(huì)議子集,其中包含142個(gè)核心AI關(guān)鍵詞,我們看到中國在過去二十年中再次見到會(huì)議論文最大幅度的增長。然而,這一增長與該地區(qū)同年幾年的會(huì)議論文總體增長沒有顯著差異。事實(shí)上,對(duì)于除美國以外的每個(gè)地區(qū),其標(biāo)題中具有核心AI術(shù)語的會(huì)議論文的增長率,低于DBLP跟蹤的會(huì)議論文總體增長率,而美國的差異并不顯著(見圖3.13)。
如果與AI相關(guān)的學(xué)術(shù)活動(dòng)數(shù)量越來越多,以其標(biāo)題中具有核心AI關(guān)鍵詞的會(huì)議論文數(shù)量來衡量,則在DBLP審查的數(shù)據(jù)中并不明顯。然而,DBLP數(shù)據(jù)的多個(gè)問題,包括對(duì)某些計(jì)算機(jī)科學(xué)主題的不完整報(bào)道,使得無法得出明確的結(jié)論。為了更好地衡量該領(lǐng)域的研究活動(dòng),需要進(jìn)一步研究以了解DBLP語料庫如何反映現(xiàn)實(shí)世界的會(huì)議研究活動(dòng),以及計(jì)算機(jī)科學(xué)的哪些領(lǐng)域在數(shù)據(jù)庫中具有更好的覆蓋率。
在中國,企業(yè)部門的會(huì)議論文占所有出版物的比例較高,而政府部門的比例最低。在歐洲,企業(yè)部門在會(huì)議論文中所占比例僅略高,政府部門所占比例略低,但與中國相比差異不那么明顯。在美國,企業(yè)部門的會(huì)議論文比例一直較高。政府板塊的會(huì)議論文占比較高,近年來有所下降。
在這些地區(qū)內(nèi),我們根據(jù)出版物數(shù)量和FWCI確定關(guān)鍵機(jī)構(gòu)。這些信息應(yīng)該放在整個(gè)區(qū)域產(chǎn)出和引用影響的背景下看待,以便深入了解一個(gè)區(qū)域的制度結(jié)構(gòu),即如果一個(gè)地區(qū)有幾個(gè)中等規(guī)模的人工智能貢獻(xiàn)者,那么與那些擁有大型集中研究機(jī)構(gòu)的地區(qū)相比,這個(gè)地區(qū)的排名可能會(huì)更低。人工智能出版物產(chǎn)出的主要100個(gè)貢獻(xiàn)者占全球人工智能語料庫的41%(99000vs241000),占全球會(huì)議論文的32%(109000vs338000)。中國在前100名中脫穎而出,主要貢獻(xiàn)者超過三分之一(37),而美國(19)和歐洲(21)共同占三分之一,其余國家占據(jù)最后三分之一。這三個(gè)主要地區(qū)占全球人工智能出版物貢獻(xiàn)者的75%。圖3.17顯示了每個(gè)地區(qū)的一些主要貢獻(xiàn)者。美國不僅有兩個(gè)主要的企業(yè)貢獻(xiàn)者,而且美國微軟也是引用影響的杰出貢獻(xiàn)者。所有五大貢獻(xiàn)者的引用影響都比世界平均水平高三到五倍。歐洲由法國機(jī)構(gòu)主導(dǎo),其次是英國和西班牙的機(jī)構(gòu)。法國和意大利擁有強(qiáng)大的國家政府研究組織CNRS和CNR。
中國的其他主要貢獻(xiàn)者(按人工智能出版物的數(shù)量排序)是華中,北航,東北,東南,武漢,西安交通,大連,華南和西電的大學(xué)。在美國,以下大學(xué)也對(duì)全球人工智能研究機(jī)構(gòu)作出了相當(dāng)大的貢獻(xiàn):南加州,佐治亞理工學(xué)院,伊利諾伊州厄巴納-香檳分校,伯克利分校,哈佛大學(xué),馬里蘭州,華盛頓,德克薩斯州奧斯汀,密歇根大學(xué),哥倫比亞。在歐洲,我們注意到以下大學(xué)是AI出版物的主要貢獻(xiàn)者:愛丁堡(英國),Leuven(比利時(shí)),Politecnica de Catalunya(西班牙),牛津(英國),倫敦大學(xué)學(xué)院(英國),Politecnica de Madrid (西班牙),曼徹斯特(英國),慕尼黑技術(shù)大學(xué)(德國),里斯本(葡萄牙)和代爾夫特(荷蘭)。其他地區(qū)如新加坡,伊朗,加拿大,臺(tái)灣,香港,日本和澳大利亞等在前100名中脫穎而出,每個(gè)地區(qū)都有兩個(gè)主要的貢獻(xiàn)機(jī)構(gòu)。雖然它們不是一個(gè)關(guān)鍵區(qū)域,但它們可能是重要的參與者。與法國,英國或西班牙等同行相比,德國等其他國家的聯(lián)邦研究機(jī)構(gòu)可能代表性不足。
人工智能競(jìng)賽的特例
與學(xué)術(shù)界平齊或互補(bǔ),競(jìng)賽是傳播人工智能研究的另一個(gè)重要舞臺(tái),也被用作招聘、培訓(xùn)和協(xié)作的工具。為此,我們考察了Kaggle,這是一個(gè)主辦公共數(shù)據(jù)和機(jī)器學(xué)習(xí)競(jìng)賽的領(lǐng)先平臺(tái),也是一個(gè)由數(shù)據(jù)科學(xué)家和機(jī)器學(xué)習(xí)專家組成的動(dòng)態(tài)社區(qū)。
競(jìng)賽獎(jiǎng)勵(lì)的范圍從知識(shí)到聲望,再到經(jīng)濟(jì)獎(jiǎng)勵(lì),因競(jìng)賽類別而異。特色競(jìng)賽通常有經(jīng)濟(jì)獎(jiǎng)勵(lì),招聘競(jìng)賽提供工作,研究競(jìng)賽解決復(fù)雜問題,并有助于社區(qū)內(nèi)的突破。例如,有一項(xiàng)競(jìng)賽是為一種算法而舉辦的,該算法能夠在cern粒子碰撞中識(shí)別希格斯玻色子。這些競(jìng)賽主要用作教育工具,反映了該領(lǐng)域的協(xié)作性質(zhì)。然而,有經(jīng)濟(jì)激勵(lì)的競(jìng)賽在競(jìng)賽中確實(shí)占了相當(dāng)大的比例。工作機(jī)會(huì)占競(jìng)賽報(bào)酬的1%,通常由硅谷的公司和公司提供。在Kaggle上提供的經(jīng)濟(jì)獎(jiǎng)勵(lì)差別很大,像在Kaggle上這樣的競(jìng)賽,參賽人數(shù)不一定與提供的獎(jiǎng)金數(shù)量相關(guān)。高額的經(jīng)濟(jì)獎(jiǎng)勵(lì)似乎會(huì)導(dǎo)致參與者數(shù)量的激增,但許多提供非經(jīng)濟(jì)獎(jiǎng)勵(lì)的競(jìng)賽比提供工作或經(jīng)濟(jì)獎(jiǎng)勵(lì)的競(jìng)賽提交的申請(qǐng)更多。
看看按地區(qū)上傳數(shù)據(jù)集的組織,顯然Kaggle在很大程度上由美國主導(dǎo),其1,041個(gè)數(shù)據(jù)集中有1,074個(gè)由美國境內(nèi)的組織提供。這些數(shù)字并不反映個(gè)人上傳的數(shù)量,因?yàn)樵谏蟼鞯?,572個(gè)數(shù)據(jù)集中,只有1,441個(gè)是由組織上傳的。圖3.18分析了Kaggle數(shù)據(jù)集,并提供了對(duì)社區(qū)的進(jìn)一步見解,特別是顯示一些下載和查看最多的數(shù)據(jù)集與競(jìng)賽無關(guān),但其足夠強(qiáng)大,足以讓用戶不斷為他們的分析做出貢獻(xiàn)。
2017年,Kaggle對(duì)其用戶進(jìn)行了一項(xiàng)調(diào)查,以收集有關(guān)社區(qū)的信息,并收到了1.6%的Kaggle用戶的回復(fù)。大多數(shù)Kaggle用戶在亞洲、美國和歐洲。這三個(gè)地區(qū)約占用戶是70%,在美國超過四分之一。在歐洲,至少有400名來自英國、法國和德國的受訪者。這些國家在人工智能領(lǐng)域的主導(dǎo)地位反映在50位頂級(jí)用戶的分布上,其中10位來自法國,9位來自英國,6位來自德國。亞洲(不包括中國)也占調(diào)查受訪者的很大比例。印度占受訪者總數(shù)的16.8%,排名前150位的用戶占9.3%。在Kaggle調(diào)查中,只有3%的受訪者來自中國,前100名用戶中只有10名中國公民,其中40%居住在海外。中國用戶的缺乏可能與該國網(wǎng)站的相對(duì)模糊性有關(guān),其中包括阿里巴巴天池網(wǎng)站,最新活動(dòng)和天池競(jìng)賽頁面以及DataCastle等競(jìng)爭(zhēng)對(duì)手的本地網(wǎng)站數(shù)量龐大,注冊(cè)數(shù)量為75,208用戶。其他受歡迎的比賽由數(shù)據(jù)基金會(huì),Kesci,中國計(jì)算機(jī)聯(lián)合會(huì),Biendata,大數(shù)據(jù)研究中心,黑客數(shù)據(jù),Soda等等舉辦。這可能表明中國更偏好國內(nèi)比賽。
AI知識(shí)轉(zhuǎn)移
除研究出版物外,研究合作是地區(qū)、學(xué)科和部門之間學(xué)術(shù)交流和知識(shí)轉(zhuǎn)移的核心要素。合作已成為創(chuàng)新和卓越、跨越邊界、學(xué)科和社區(qū)的基石。低成本旅行、高速互聯(lián)網(wǎng)連接、移動(dòng)技術(shù)、社交媒體、公眾參與和資助計(jì)劃推動(dòng)了發(fā)展,鼓勵(lì)學(xué)者、社區(qū)和政策制定者將其網(wǎng)絡(luò)擴(kuò)展到其直接的工作環(huán)境和傳統(tǒng)的影響范圍之外。
人才從一個(gè)部門遷移到另一個(gè)部門是另一種知識(shí)轉(zhuǎn)移方式,特別是在新興領(lǐng)域。 LinkedIn Talent解決方案最近的一項(xiàng)研究顯示了學(xué)術(shù)界人才流向企業(yè)部門。另一方面,《衛(wèi)報(bào)》和《金融時(shí)報(bào)》指出,學(xué)術(shù)界正面臨著研究人才的更高競(jìng)爭(zhēng)。
單一作者身份在所有地區(qū)都在下降,人工智能研究正在變得更加協(xié)作。歐洲和美國在國際上的合作越來越多。對(duì)于美國而言,這不僅帶來了出版物份額的擴(kuò)大,也帶來了更高的引用影響。相比之下,歐洲的國際合作主要是出版物份額。中國正在減少其機(jī)構(gòu)合作并轉(zhuǎn)向國家和國際合作。它的國際合作帶來了比美國和歐洲更大的引用影響。在三個(gè)地區(qū)的國際合作(圖3.21)的直接比較中,我們看到歐洲出版量的強(qiáng)勁增長,以及中國通過國際合作增加數(shù)量和引用影響的成功。
超過90%的AI研究由學(xué)術(shù)部門制作。然而,通過代表兩個(gè)部門的作者的出版物來分析學(xué)術(shù) - 企業(yè)合作,在知識(shí)轉(zhuǎn)移和創(chuàng)新方面發(fā)揮著關(guān)鍵作用。快速研究轉(zhuǎn)移到應(yīng)用程序是政府和創(chuàng)新計(jì)劃的關(guān)鍵目標(biāo),刺激經(jīng)濟(jì)發(fā)展和創(chuàng)造就業(yè)機(jī)會(huì)。
在全球所有領(lǐng)域內(nèi),學(xué)術(shù) - 企業(yè)合作獲得更高的引用率,這也是每個(gè)地區(qū)開展的人工智能研究的情況(圖3.22)。這種跨部門合作在美國尤為突出,占其產(chǎn)量的近9%,其引用影響超過世界平均水平的三倍。這可以通過強(qiáng)大的美國AI公司來解釋,微軟和IBM等公司對(duì)人工智能的學(xué)術(shù)產(chǎn)出和影響做出了重大貢獻(xiàn)。中國的學(xué)術(shù)和企業(yè)出版物的全球平均份額低于3%,歐洲略高于3%,這兩個(gè)地區(qū)在這些合作中都獲得了類似的引文影響。
除了研究合作之外,研究人員的流動(dòng)性表明了知識(shí)交流 - 以及研究人員實(shí)際遷移到其他地區(qū)。圖3.23說明了每個(gè)區(qū)域的每個(gè)移動(dòng)類的份額。