Github 日前發(fā)布了 2016 年度的《Octoverse 觀察報告》,對開源和社區(qū)做了統(tǒng)計,與人工智能開源運動相比,得到一些有趣的結果:印象中的“開源大戶”谷歌并不是開源項目最多的公司(答案請見內文),但發(fā)布不到兩年的 TensorFlow 已登上最受歡迎 repos 榜單。AI 巨頭中,貢獻者最多的項目屬于 Facebook,微軟緊隨其后,但貢獻者還是出自微軟的人數(shù)最多;全球 Github 新增用戶中,中國表現(xiàn)突出,增長率高達 97%。
TensorFlow 是最受歡迎的開源項目
從讓阿波羅 11 號登月的代碼到幫助非盈利組織的開源課程,過去一年中,GitHub 上涌現(xiàn)了一大批開源項目。以下是最受歡迎(得到星標最多)的項目:
由上圖可見,TensorFlow 是唯一上榜的深度學習庫,可見其近 12 個月來的傳播程度,也從另一個側面表明,谷歌的宣傳能力或者說號召能力成效顯著。當然,深度學習也確實隨著開源逐漸流行,谷歌和 TensorFlow 的貢獻很多。
最受歡迎的編程語言
GitHub 開源項目一共使用了 316 種不同的編程語言,其中根據(jù)過去一年提交的 Pull Request(用于向項目提交補丁,反映項目熱度及受歡迎程度)使用最多的前 15 種編程語言如下。
其中,最受歡迎的編程語言是 Java,超出第二名 Java 一倍多。作為深度學習最常用語言的 Phython 位居第三。
新智元此前曾經(jīng)報道過谷歌工程師最愛用的 10 種編程語言:
Java
Java
C/C++
Go
Python
Type
Dart
PHP
Objective-C
C#
對照來看,谷歌工程師最愛用的也是 Java,自家的產(chǎn)品 Go 當然也排名靠前。
Github 貢獻者最活躍的項目
貢獻對項目推送了代碼、對打開或評論了問題,或者提交 Pull Request?;钴S則表示有過代碼提交、寫備注、被星標和問題匯報 issue 等行為。
據(jù)統(tǒng)計,過去一年來,Github 有 580 萬以上的活躍用戶、33 萬以上的活躍組織、1.9 億以上的活躍項目,以及 1000 萬以上的活躍問題匯報。
其中,按照項目貢獻者活躍度排名:
貢獻者人數(shù)最多的機構
貢獻者人數(shù)最多的機構,微軟位居第一。
當然,貢獻者人數(shù)與公司員工數(shù)量有一定關系,微軟全球員工加起來超過 Facebook 員工總數(shù)的 10 倍還要多,因此,Github 這個排名實際上凸顯了 Facebook 人的活躍。
相比之下,谷歌的排名就有些不太好說了……難道都去做自家公司的項目了?
Fork 最多的項目
Fork 越多,代表對這個項目感興趣、有可能會參與開發(fā)的人越多。
在這里,TensorFlow 再次展現(xiàn)實力——雖然排名第五,要知道,排名第一的 datasharing 是一篇文章,排名第二的 Spoon-Knife 和第三的 ProgrammingAssignment2 都是教程。
可以說,TensorFlow 名副其實是 Github 深度學習開源第一庫。這么看來,微軟的 CNTK 或需加強宣傳力度。
Github 新增用戶中國排名第一
GitHub 上已經(jīng)有超過 520 萬的用戶和超 30 萬的機構。過去一年來,有超過 81 萬人首次提交 Pull Request,有 280 萬人創(chuàng)造了自己的第一個項目。
其中,中國是新用戶注冊增長最多的國家,同比增長 97%,由此可見 GitHub 在中國的接受度大幅提高。
全球進入?yún)f(xié)同編程時代
由上圖可以見,絕大部分 PR 都是由機構發(fā)起的,說明全球正進入大規(guī)模協(xié)同編程時代。這與從 2015 年底開始的深度學習開源運動潮流相符。
報告原文地址:https://octoverse.github.com/