計算機學家Mark Howison正在準備分析提取自24個管水母目動物的RNA,這種海洋動物與水母和珊瑚關(guān)系密切。但美國羅得島州布朗大學的本地高性能計算機在維修之后并沒有恢復充分的可靠性。于是,Howison決定使用亞馬遜的彈性計算云。兩個小時后,Howison配置了一臺虛擬計算機運行他的軟件,并上傳了管水母目動物的序列。14小時、花費61美元,分析完成。
越來越多像Howison這樣的研究人員,選擇從亞馬遜和谷歌等商業(yè)供應商手中在線租借計算資源,而且不僅僅限于緊急備份。2013年,美國國家科學基金會(NSF)資助的一項調(diào)查顯示,云為實驗室提供了接觸到它們難以從其他地方獲得的計算能力。需要強大計算能力的科學家只需要租借額外的計算能力,而非購買永久硬件。
科學家能配置云環(huán)境,以適應自己的需求。盡管云計算不能處理需要最先進超級計算機進行的分析工作,或機器間的互聯(lián),它可能只適合太大而無法在臺式機上完成或太小而不值得使用高性能超級計算機的項目。而且,在線工作讓研究團隊可以更容易地展開合作,分享數(shù)據(jù)的虛擬快照、軟件和計算配置。
但將科學轉(zhuǎn)移到云上,并不是一個輕松的任務。“你需要一個技術(shù)背景。針對一個像科學家這樣的終端用戶進行設計,這并非易事。”Howison說。盡管活化能量可能較高,但這里為嘗試為自己的研究或?qū)嶒炇遗渲迷骗h(huán)境的科學家推薦了路徑。
大部分云平臺都要求使用者具備基本的計算機技術(shù)。例如,理解命令行是如何工作的,以及能熟練使用操作系統(tǒng)和文件結(jié)構(gòu)。一旦研究人員擁有了堅實的計算機基礎,下一步就是嘗試在云中工作了。
普吉特灣大學植物生物學家Andreas Madlung表示,部分對科學家而言容易使用的云可能是Atmosphere平臺。他參與創(chuàng)建了名為iPlant的協(xié)作網(wǎng)絡基礎設施項目。這個由NSF資助、美國3所大學和冷泉港實驗室領(lǐng)銜的項目,自2008年起,就幫助科學家分享軟件和進行免費分析。
考慮到科學家的需要,該平臺的界面設有預先載入的軟件、一系列操作數(shù)據(jù)集和討論區(qū),以便用戶彼此幫助解決問題。Madlung還負責教授生物信息學本科課程,其中就包括云計算的章節(jié)。他首先向?qū)W生介紹了Unix操作系統(tǒng),然后讓他們使用相關(guān)知識在Atmosphere平臺分析RNA序列數(shù)據(jù)。
那些注冊iPlant的用戶,被自動分配到每月約168小時的處理時間。而且如果有需要,用戶還能申請更多時間。用戶能加載攜帶其需要的額外軟件的虛擬計算機,并且如果一項工作對于標準設備而言過于繁重,任務會被卸載給得克薩斯高級計算中心的超級計算機。
加州大學戴維斯分校生物學家Mike Covington由于超載使得服務器頻繁崩潰,后將自己實驗室的計算工作轉(zhuǎn)移到了iPlant。他還制作了自己的虛擬計算機副本,以便合作者和iPlant的用戶能登入和使用相同的軟件、數(shù)據(jù)和計算結(jié)構(gòu)。“如果我能花費數(shù)小時設置好自己的虛擬計算機并完美地進行de novo基因裝配,我也能迅速并簡便地讓其他希望進行相同工作的科學家使用它。”Covington說。
而這些虛擬快照可能成為那些需要計算工作的項目的標準。例如,任何需要復制一篇論文中的微生物基因組分析的人,都能使用作者在亞馬遜云上提供的虛擬計算機快照,只需要支付使用時間費用。
對于一些研究人員而言,選擇一個云平臺是簡單的。自2013年起,歐洲核子研究委員會的科學家就開始使用一個大型的內(nèi)部云平臺,康奈爾大學和圣母大學等機構(gòu)也在開發(fā)云計算。而布朗大學進化生物學家Casey Dunn更喜歡培訓學生使用商業(yè)平臺。“當他們在其他地方開始博士后工作或擁有自己的實驗室時,他們?nèi)阅艿卿泚嗰R遜。”他說。
斯坦福大學基因組學和個性化醫(yī)療中心生物信息學部門主任Somalee Datta就正在使用谷歌的云平臺——而非僅僅依賴斯坦福大學的計算服務——支撐該中心龐大的基因數(shù)據(jù)和計算需求。她說,選擇谷歌的原因有幾個:該公司研發(fā)者積極為基因組研究開發(fā)工具,谷歌在衛(wèi)生保健研究方面也展示了興趣,并且價錢合理。
對于Datta和其他人而言,圍繞云計算的一個重要議題是安全性。“這是一個極大的關(guān)注點。”她說,“黑客知道什么是有價值的,他們將把注意力集中在這里。”而且,Datta認為云計算并不比其他計算機網(wǎng)絡安全。例如,一所大學的云系統(tǒng)僅像其防火墻一樣堅固。
困擾打算進入云平臺的研究人員的另一個問題是所需要的技術(shù)支持水平。獲得在新系統(tǒng)上運行的軟件可能需要數(shù)天,并需要反復嘗試計算能力或虛擬計算機的記憶能力。盡管所有云服務者都提供培訓和教程,但專門的技術(shù)服務人員在擁有校園云的大學中更為常見。
盡管存在挑戰(zhàn),但云計算正吸引著越來越多的科學家投身其中。Dunn表示,這并不令人驚訝,“幾乎所有的計算機產(chǎn)品消費者都擁有一個云,可能是移動應用程序、流媒體服務或桌面工具”。