你可能從來沒有聽說已故Jim Weirich或他開發的軟件。但是你幾乎肯定會使用過在他研究基礎上開發出的各種應用程序。
Weirich為面向對象(面向對象程序設計)腳本語言Ruby創建了幾個關鍵工具,Ruby是Hulu,Kickstarter,Twitter和其他無數主流網站代碼的編程語言。Ruby的代碼是開源的,這意味著任何人都可以使用它并對其進行修改。 Ruby開發人員兼軟件公司Test Double聯合創始人Justin Searls說:“Weirich是西方世界Ruby社區的創始人之一。
當Weirich于2014年去世時,Searls注意到沒有人再去維護Weirich的一個軟件測試工具。這意味著如果其他開發者再向Ruby社區提交關于Ruby語言的錯誤修復,安全補丁或其他改進,就不會有人批準更改。任何依賴該工具的測試最終都會失敗,因為代碼會隨著時間推移變得過時,并且與新技術不再兼容。
事件凸顯了開源軟件社區日益關注的一個問題。當程序員過世后他們所編寫的代碼會怎么樣?關于在用戶死后其社交媒體賬戶會發生什么的文章已經寫得很多了。但關于程序員過世這個問題沒有那么嚴重。部分原因是因為大多數公司和政府所運行的都是商業軟件,都有專人維護。但現暫,更多的程序依賴于像Weirich這樣的程序員所開發的晦澀難懂但卻重要的開源軟件。
一些開源項目是眾所周知的,如Linux操作系統或Google的人工智能框架TensorFlow。但是這些項目中都依賴于更小的開源代碼庫。而這些開源代碼庫又是基于另一個代碼庫。結果構成了一個復雜的,不為人知的相互依存的軟件網絡。
這可能會帶來很大的問題,如2014年,在OpenSSL中發現了一個被稱為“Heartbleed”的安全漏洞,幾乎每個處理信用卡或借記卡支付過程的網站都會使用這個開放源代碼程序。該軟件與大多數Linux版本捆綁在一起,但由幾個志愿者維護,他們沒有時間或資源進行廣泛的安全審計。在Heartbleed安全漏洞被發現后不久,在另一個常見的開源應用程序Bash中也發現了一個同樣的安全問題,這使得無數的Web服務器和其他設備很容易受到攻擊。
肯定還有更多未發現的漏洞。 Libraries.io是一個分析軟件項目之間關系的團隊,其已經確定了超過2,400個開源代碼庫在其他1000個程序中使用,但是很少受到開源社區的關注。
安全問題只是這個問題的一部分。如果軟件庫無法及時更新,軟件升級后也就無法運行。這意味著在用戶在更新了相應軟件之后,那些依賴于過期庫的應用程序可能無法工作。當維護代碼庫的開發人員離世或放棄一個項目時,使用該軟件的每個人都會受到影響。去年,當程序員AzerKo ulu從互聯網上刪除了一個叫做Leftpad的代碼庫后時,它造成了漣漪效應,據說在Facebook,Netflix和其他很多地方都引起了令人頭痛的問題。
大巴系數
一個開源軟件的維護者越少,其被孤立的風險就越大。開發商甚至有這樣一個病態的名字:大巴系數,這意味著在沒有人維護開源項目的情況下會受到影響的人數。 Libraries.io已經確定了大約3000個開源庫,在許多其他程序中使用,但只有極少數的人在默默貢獻。
項目孤立是使用開源軟件的風險,但商業軟件制造商也可能會停止支持或更新舊程序,從而給用戶帶來同樣的麻煩。在某些情況下,別有用心的程序員會采用孤立的開源代碼。
這就是Searls在處理Weirich開源項目中遇到的一個問題。 Weirich最受歡迎的項目在他去世的時候有共同管理者。但是Searls注意到一個測試工具Rspec-Given沒有被移交出去,他有意負責更新,但一路上遇到了不少麻煩。
Rspec-Given的代碼托管在代碼托管和協作站點GitHub上,后者目前擁有6700萬個代碼庫。 Weirich在GitHub上的Rspec-Given頁面是其他Ruby用戶報告錯誤或自愿幫助改進代碼的主要地方。但GitHub不會讓Searls控制這個頁面,因為Weirich在他去世之前還沒有進行命名。所以Searls必須創建一個新的代碼副本,并將其轉移到其他地方。他還必須說服分發代碼的“包管理系統”Ruby Gems運營商使用他的Rspec-Given版本,而不再是Weirich的版本,以便使所有用戶都能訪問的變更。 GitHub拒絕討論其關于轉移項目控制的政策。
相關方法能夠解決與Rspec-Given有關的潛在問題,但是它也讓Searls看到了許多可能出潛在問題。 Searls說:“我們很容易將開源看作一種純粹的技術現象。但是,一旦有些事情產生,并且被其他人所依賴,這也是一種社會現象。”
大多數軟件包管理系統的維護人員至少有一個專門的流程來轉移對庫的控制權,但是這個過程通常取決于是否有人能夠注意到項目已經被孤立,然后自愿接管它。 Ruby Gems項目的Evan Phoenix說:“我們沒有官方政策,主要是因為它不會經常出現。 “我們有一個顧問委員會,用來逐個處理這種類型的事情。”
現在,一些軟件包管理人員會監視他們的庫運行狀態,并標記那些很久沒有更新且使用頻繁的項目。協助維護編程語言Perl軟件包管理器的Neil Bowers說,他有時候會尋找志愿者接管孤立項目。鮑爾斯說,他的小組時常會指出,一個項目已經被開發者放棄,并推薦接管人。
一個“去世開關”
Searls接管Rspec-Given時只有30歲,他為自己的開源項目制定了遺囑和繼任計劃。除此之外,開發人員還可以針對未來做出其他努力。例如,他們可以將版權轉讓給諸如Apache基金會等其他組織。但是許多開源項目本質上是以業余愛好開始的,所以程序員可能不會想到轉移所有權,想到時已經為時已晚。
Searls認為,GitHub和Gems等軟件包管理者可以在他們的平臺上添加一個類似于“去世開關”的東西,如果創建者沒有登錄或者長時間沒有更新,程序可以自動將項目或者帳戶的所有權轉讓給其他人。
而過渡計劃不僅僅是讓人們能夠訪問代碼。Matplotlib是一個Python編寫的2D數字繪圖庫,在創始人約翰·亨特(John Hunter)于2012年去世后,Michael Droettboom進行了接管。他指出,繼任者也需要了解這些代碼。他說:“有時候只有一個人可以理解部分代碼。知識只存在于一個人的頭腦中。”
這意味著理想情況是,一旦項目被原始開發人員以外的人使用,就需要讓其他人盡早參與一個項目。 Searls指出,這還有另外一個好處,那就是分配維護項目的工作,以防止開發人員產生倦怠。