在醫(yī)學(xué)及生物學(xué)領(lǐng)域里,只要涉及到基因組的研究項目,往往至關(guān)重要卻又花銷不菲,上個世紀(jì)提出的人類基因組計劃還沒有完成,預(yù)算卻已達(dá)30億美元。由于技術(shù)的發(fā)展,基因組測序及DNA解碼的速度越來越快,所獲得的基因組數(shù)據(jù)也爆炸性增多,僅僅一個研究所每30分鐘就可產(chǎn)生200TB的原始數(shù)據(jù),這些數(shù)據(jù)的存儲與處理,又成了一個亟待解決的問題。
云服務(wù)使低價基因組數(shù)據(jù)存儲成為現(xiàn)實
就目前的情況來說,解碼基因組所獲取的原始數(shù)據(jù)一般是交給大型的商業(yè)數(shù)據(jù)中心來存儲,代價十分高昂。去年十月,美國國家癌癥研究所宣布耗資1900萬美元將2.6PB的癌癥基因圖譜數(shù)據(jù)轉(zhuǎn)移到云服務(wù)器,就數(shù)據(jù)量而言,這個價格相比于普通的商業(yè)數(shù)據(jù)中心已經(jīng)算是十分低廉。可是由于科研經(jīng)費(fèi)有限,數(shù)據(jù)量又十分巨大,對于存儲基因組數(shù)據(jù),科研機(jī)構(gòu)依舊捉襟見肘。
不久前,谷歌率先提出了一項專門針對基因組存儲的云端服務(wù),提供了專門的網(wǎng)絡(luò)結(jié)構(gòu)和瀏覽器供研究人員搜索數(shù)據(jù)。隨后,亞馬遜、微軟與IBM等云服務(wù)巨頭也緊跟其后,并且與谷歌打起了價格戰(zhàn),谷歌表示,每個基因組每年的存儲費(fèi)用大約為25美元,如果數(shù)據(jù)經(jīng)過壓縮,費(fèi)用還可降低至0.25美元一年。
或?qū)⒋龠M(jìn)基因研究大發(fā)現(xiàn)
從前,各研究所解碼的基因組數(shù)據(jù)分散在許多不同的商業(yè)數(shù)據(jù)中心里,相對而言比較閉塞,信息流通不暢,給科學(xué)研究帶來了一定的阻礙。而現(xiàn)在,基因組的云存儲模式如果能持續(xù)發(fā)展下去,不僅會促進(jìn)生物醫(yī)學(xué)界,還能催生新的商業(yè)機(jī)會。
事實上,國外已經(jīng)有許多初創(chuàng)公司被云服務(wù)所推動而獲得了快速發(fā)展,如DNANexus和sevenbridge等,這些公司推出了面向醫(yī)院和科學(xué)家的檢索軟件,以供他們檢索基因數(shù)據(jù)。同樣的,由于檢索對比基因組數(shù)據(jù)變得十分容易,未來的醫(yī)療可能會基于某種“全球基因網(wǎng)絡(luò)”。如果某位患者身患癌癥,醫(yī)生只要對其正常細(xì)胞的基因組和其癌細(xì)胞的基因組測序,然后與云端服務(wù)器中的上億組數(shù)據(jù)對比,就有很大概率準(zhǔn)確的發(fā)現(xiàn)問題所在,并提供可靠的的治療方案。
通過將基因組數(shù)據(jù)存儲到云端,不僅節(jié)省了成本,還使得可以生物學(xué)家同時對成百上千萬的基因進(jìn)行研究,這無疑會大大加快基因研究的步伐。