近日,kdnuggets做了一個(gè)關(guān)于數(shù)據(jù)科學(xué)、機(jī)器學(xué)習(xí)語(yǔ)言使用情況的問(wèn)卷調(diào)查,他們分析了954個(gè)回答,得出結(jié)論——Python已經(jīng)打敗R語(yǔ)言,成為分析、數(shù)據(jù)科學(xué)和機(jī)器學(xué)習(xí)平臺(tái)中使用頻率最高的語(yǔ)言。有關(guān)此次問(wèn)卷更具體的情況如何?雷鋒網(wǎng)(公眾號(hào):雷鋒網(wǎng)) AI科技評(píng)論將kdnuggets上發(fā)表的總結(jié)文編譯整理如下:
之前我們?cè)趉dnuggets上做了這樣一個(gè)問(wèn)卷調(diào)查,2016、2017兩年,在分析、數(shù)據(jù)科學(xué)和機(jī)器學(xué)習(xí)的工作中,你用R語(yǔ)言,還是Python,或兩者都用,或選擇其他的語(yǔ)言?
通過(guò)分析954個(gè)回答,我們得出了這樣的結(jié)論:雖然Python并沒(méi)有完全取代R語(yǔ)言,但在2017年,Python已經(jīng)成功打敗R語(yǔ)言,成為分析、數(shù)據(jù)科學(xué)和機(jī)器學(xué)習(xí)平臺(tái)中使用頻率最高的語(yǔ)言。
在2016年P(guān)ython還是第二位(主要用Python的人占34%,主要用R語(yǔ)言的人占42%),在2017年P(guān)ython就以5%的優(yōu)勢(shì)領(lǐng)先于R語(yǔ)言(主要用Python的人占41%,主要用R語(yǔ)言的人占36%)。同時(shí)用Python和R兩種語(yǔ)言的人也從2016年的8.5%增長(zhǎng)到12%了,而用其他語(yǔ)言的人則從16%降到11%。
圖1:2016-2017年,在分析、數(shù)據(jù)科學(xué)和機(jī)器學(xué)習(xí)中使用Python、R語(yǔ)言、Python和R語(yǔ)言、其他語(yǔ)言的占比
之后,我們分析了大家在不同語(yǔ)言之間的轉(zhuǎn)換情況。
圖2:2016-2017年,分析、數(shù)據(jù)科學(xué)以及機(jī)器學(xué)習(xí)平臺(tái)中各種語(yǔ)言的轉(zhuǎn)換情況
這張圖看起來(lái)很復(fù)雜,不過(guò)從中可以很容易地看出Python在忠誠(chéng)度和轉(zhuǎn)換率兩個(gè)關(guān)鍵層面都領(lǐng)先于其他語(yǔ)言。
忠誠(chéng)度:使用Python的用戶對(duì)它的忠誠(chéng)度要高于使用其他語(yǔ)言的用戶。2016年使用Python的用戶中,有91%的人2017年還在繼續(xù)使用它,而R語(yǔ)言的用戶留存率為74%,其他語(yǔ)言的用戶留存率則為60%。
轉(zhuǎn)換率:從2016年到2017年,只有5%的Python用戶轉(zhuǎn)向R語(yǔ)言,而R語(yǔ)言用戶轉(zhuǎn)向Python的則是10%,這是前者的兩倍。另外,2016年同時(shí)使用兩種語(yǔ)言的人中,只有49%的人還在繼續(xù)使用這兩種語(yǔ)言,38%的人轉(zhuǎn)向Python,11%的人轉(zhuǎn)向R語(yǔ)言。
接下來(lái)我們看一下2014-2017年這幾種語(yǔ)言的使用趨勢(shì)。
因?yàn)槲覀?015年【R vs Python】的問(wèn)卷調(diào)查中沒(méi)有提供【同時(shí)使用兩種語(yǔ)言】這個(gè)選項(xiàng),因此下面2014-2016這四年的對(duì)比趨勢(shì)圖中,2016、2017年的Python、R語(yǔ)言使用趨勢(shì)我們是這樣計(jì)算的:
Python*= (Python的比例) + 50% * (同時(shí)使用Python和R語(yǔ)言的比例)
R* = (R的比例) + 50% * (同時(shí)使用Python和R語(yǔ)言的比例)
可以看到,R語(yǔ)言的使用率在逐年緩慢下降(從2015年的50%降到2017年的36%),而Python的使用率則從2014年的23%增長(zhǎng)到2017年的47%。另外,其他語(yǔ)言的使用率也在逐年下降。
圖3:2014-2017年,Python、R語(yǔ)言及其他語(yǔ)言在分析、數(shù)據(jù)科學(xué)和機(jī)器學(xué)習(xí)的使用情況對(duì)比
最后,我們也按地區(qū)分析了幾種語(yǔ)言的使用趨勢(shì),地區(qū)分布情況如下:
美國(guó)/加拿大,40%
歐洲,35%
亞洲,12.5%
拉美,6.2%
非洲/中東,3.6%
澳洲/新西蘭,3.1%
為了簡(jiǎn)化對(duì)比圖,我們將同時(shí)使用R語(yǔ)言和Python的比例也按照上面的計(jì)算方法折算到單獨(dú)使用R語(yǔ)言和Python的比例中,并把亞洲、澳洲/新西蘭、拉美、非洲/中東這四個(gè)占比較少的地區(qū)合并為一個(gè)區(qū)域。
圖4:2016-2017年,不同地區(qū)使用Python、R語(yǔ)言和其他語(yǔ)言的情況
我們注意到不同區(qū)域的語(yǔ)言變化情況:
Python的使用率增長(zhǎng)了8-10%
R語(yǔ)言的使用率降低了大約2-4%
其他語(yǔ)言的使用率降低了5-7%
上面的數(shù)據(jù)表明了Python的使用前景很好,我們也預(yù)測(cè)R語(yǔ)言和其他語(yǔ)言的使用率還是會(huì)有相當(dāng)?shù)恼急龋驗(yàn)樗鼈冇泻苌畹母?/p>