Open Source Insider令人值得關(guān)注的是,Apache Software Foundation本月接受了MXNet機器學(xué)習(xí)項目(MXNet Machine Learning)作為一個開放源代碼項目。
這個公告最讓人驚訝的并不是ASF在眾多選擇中接受了這個項目,現(xiàn)在在軟件世界里如果沒有機器學(xué)習(xí)工具就很難翻身,而是MXNet的開發(fā)人員絕大部分都來自于亞馬遜,他們相信ASF是相關(guān)的。
MXNet是一個開放源代碼的“深度學(xué)習(xí)”框架,允許您在各種設(shè)備上定義、訓(xùn)練和部署所謂的神經(jīng)網(wǎng)絡(luò)。它也恰好是Amazon Web Services(AWS)上機器學(xué)習(xí)(ML)工具的選擇,并且通過已經(jīng)部署好的EC2實例可用。
深度學(xué)習(xí)是目前非常流行的機器學(xué)習(xí)的子集,專注于具有非線性的分層算法,這有助于在數(shù)據(jù)集中找到模式和學(xué)習(xí)陳述。說它在發(fā)現(xiàn)的時候?qū)W習(xí),這是一種奇怪的說法。由于它在語音識別、自然語言理解和推薦系統(tǒng)(例如Siri、Alexa等)等應(yīng)用程序中取得了成功,深度學(xué)習(xí)目前廣受歡迎。每次當(dāng)你坐在沙發(fā)上對著Alexa大喊大叫,都是在使用深度學(xué)習(xí)系統(tǒng)。
亞馬遜聲稱MXNet是該公司擁有的最具擴展性的工具,這讓MXNet在現(xiàn)在這個階段變得非常有趣,亞馬遜可是一家知道哪些東西具有擴展性而哪些東西沒有擴展性的公司。
MXNet遠(yuǎn)非深度學(xué)習(xí)領(lǐng)域唯一的寵兒。事實上,它加入這場游戲的時候已經(jīng)有點晚了。深度學(xué)習(xí)世界中的其他流行工具包括在Facebook、谷歌和NYU使用的Torch以及微軟的Adam,但也許最大的直接競爭對手是谷歌的TensorFlow。TensorFlow是開放源代碼的,使用Apache許可證,并在本月發(fā)布了1.0版本,客戶已經(jīng)開始使用了。
谷歌在AWS上使用Tensorflow已經(jīng)超過一年了。谷歌已經(jīng)在旗下很多谷歌服務(wù),例如Gmail和Google Photos上使用它,而且谷歌在2015年11月針對滿懷熱情的測試者們提供了一個穩(wěn)定的版本,比AWS收購MXNet早了整整12個月。去年六月,谷歌聲稱Github上有1500個存儲庫提到了TensorFlow,其中只有五個來自于谷歌自己。
如果你是開放源代碼世界中的新人,機器學(xué)習(xí)工具和開發(fā)人員通常都是如此,那么你對于ASF缺乏真正的了解是可以被原諒的。
即使你非常熟悉ASF,你可能仍然好奇為什么像亞馬遜這樣一家數(shù)十億美元的公司會對于一個全是由志愿者組成的團體采用其寵愛的項目感到如此興奮?要知道ASF一年的運營費用才幾乎不到50萬美元。
答案只用一個詞就夠了:社區(qū)。
ASF成立于1999年,完全由捐款資助,ASF系統(tǒng)首先幫助Apache HTTP服務(wù)器成為網(wǎng)絡(luò)上最受歡迎的網(wǎng)絡(luò)服務(wù)器。這一成功公式已經(jīng)被一些最新的成功重復(fù)證實,包括Hadoop、 Spark、Tomcat和Struts。在受到對OpenOffice破壞性的控制的傷害之后,Oracle將OpenOffice放到ASF中,希望以此幫助其得到更廣泛的采用。
ASF孵化器的目的是幫助外部項目提高他們的代碼的質(zhì)量,并參與更大的社區(qū)。它是一種開放源代碼項目的蓋章認(rèn)可,證明項目是真正開放源代碼的,并使用ASF的表決程序和ASF已經(jīng)開發(fā)的所有其他的準(zhǔn)民主治理體系,也就是被神圣化地成為Apache Way的方法。
考慮到這種社區(qū)和TensorFlow社區(qū)之間的選擇,ToxFlow社區(qū)雖然是開放源代碼的,但卻在很大程度上受到谷歌的管理,MXNet就變得看起來更具吸引力。而且它的吸引力越大,參與的開發(fā)者就會越多,而代碼也會越好。如果你從機器學(xué)習(xí)的角度來思考它的話,那么ASF就是一個開發(fā)人員的學(xué)習(xí)網(wǎng)絡(luò)。
值得注意的是,并非所有進(jìn)入ASF孵化器的項目都能夠“脫離父母”。但正式的項目在能夠證明自己獨立于任何一個貢獻(xiàn)者或者贊助實體之前,都不能完成孵化階段。
孵化是一個項目成為ASF正式項目的第一步,但不能保證項目在ASF的支持下最終會成功還是終止。
孵化器的成功項目包括Cassandra、CouchDB、Mesos以及其他很多項目。還有OpenOffice,另一個孵化器的“畢業(yè)生”,但是它的風(fēng)頭在很大程度上被LibreOffice奪走了。
現(xiàn)在亞馬遜希望MXNet可以從ASF學(xué)到一些技巧,或許建立一個可以幫助其趕上競爭對手的社區(qū)。作為AWS人工智能的總經(jīng)理,Matt Wood表示,該項目希望成為Apache孵化器的一部分的原因是“利用Apache Software Foundation的流程、管理、外延和社區(qū)活動。
簡而言之,想利用ASF的影響力來吸引更多的開發(fā)者。很容易看明白亞馬遜的這一舉動是完全為了自己,事實上也是如此,但這只是這個故事的開始。
也許ASF的名字不再家喻戶曉,但它仍然有相當(dāng)?shù)挠绊懥Γ闹卫砗退^的Apache Way真的發(fā)展出了一些令人印象深刻、發(fā)展得非常好的社區(qū)項目。由于MXNet背后的原因,它打敗TensorFlow和其他產(chǎn)品的可能性相當(dāng)大。
當(dāng)然,ASF可能得到的是迄今為止最好的機器學(xué)習(xí)項目。MXNet當(dāng)然是最容易部署的一種,因為已經(jīng)有一個AWS深度學(xué)習(xí)AMI可用了,還有大量的預(yù)編譯好并已經(jīng)為使用做好準(zhǔn)備的示例代碼。之前提到的服務(wù)器實例恰好與其他AWS服務(wù)密切相關(guān),而用戶可能想要投資的服務(wù)器實例也是如此。