自二代測序的技術問世以來,就一直是研究和臨床領域關注的重點。隨著整個行業(yè)的技術發(fā)展,二代測序也帶動了整個基因研究的產業(yè)鏈。在二代測序的產業(yè)鏈中,上游做檢測,中游做分析,下游做應用。在測序價格持續(xù)下降的情況下,中游測序數(shù)據(jù)的生物信息學分析成為了提高效率最大的瓶頸。
傳統(tǒng)的測序數(shù)據(jù)分析依賴于本地服務器的性能。而可以預見的是不斷下降的測序價格將會帶來更多海量測序數(shù)據(jù)的產生,而巨大數(shù)量的測序數(shù)據(jù)無疑會延長獲得測序分析結果的時間。目前可能較好的解決方法是通過云計算的方式去做,云計算的優(yōu)勢在于能夠通過分布式計算對大數(shù)據(jù)進行處理,從而極大提升運算效率以及降低成本。
目前國外的云計算平臺Seven Bridge已經做的比較成熟,對二代測序數(shù)據(jù)也能夠進行快速分析。缺點是作為典型的pipeline式分析,對用戶的要求比較高,對于國內用戶群體的使用會有一些障礙。而在國內的云計算平臺中,GCBI將于2016年2月底發(fā)布新的全基因組測序分析平臺,雖然還沒有公布具體的信息,但是希望能夠體現(xiàn)基本功能的高效率和高可用性。
接下來我們看看在不同的領域,測序的云計算平臺可能帶來的變革與進步。
科研領域
科研研究者一直是測序的重要使用群體,由于測序成本的持續(xù)降低及更多的測序服務供應商選擇,可以預見的是測序數(shù)據(jù)的產量與規(guī)模大幅度提升。而這部分數(shù)據(jù)是必然需要分析的,在沒有大規(guī)模數(shù)據(jù)分析平臺之前,分析的效率受限于本地服務器的規(guī)模,數(shù)據(jù)量越大,分析的時間也越久。而測序的云計算平臺將有望突破這個瓶頸,100個樣本,1000個樣本,分析的時間都僅跟1個樣本的分析時間類似,這將極大降低用戶的時間成本。預計隨著數(shù)據(jù)分析平臺化的出現(xiàn),科研研究的周期將大大縮短。
臨床應用領域
在傳統(tǒng)的診療模式下,臨床醫(yī)生需要各種檢查數(shù)據(jù)以及查體來對病人進行診斷。一旦分子層面的檢測在臨床進行開展,云計算平臺可以通過對同一種疾病臨床數(shù)據(jù)及分子檢測數(shù)據(jù)的收集和快速分析,對特定的病人給出相應的輔助診斷參考,甚至給予相應的用藥方案。臨床醫(yī)生在合理應用的情況下,整個診斷的過程將會變得更快速以及更準確。如果未來疾病的發(fā)展演變成依據(jù)分子水平的變化進行分類,那么諸如GCBI等云計算平臺對臨床的幫助會更大。
個人健康
隨著測序技術在醫(yī)療領域的應用,市面上已經有不少針對個人健康的檢測業(yè)務了,檢測方法包括個人全基因組測序、定制化基因芯片等等。而這些數(shù)據(jù)的分析與解讀也會隨著檢測成本的下降變得越來越普遍。當每個人都會去做這樣的檢測時,云計算平臺將有望對這部分數(shù)據(jù)的快速解讀提供可行的解決方案。個人用戶將更快速地獲取自己的結果報告。
合作模式
鑒于生物信息云計算平臺的強大功能,有望在平臺與科研單位、臨床研究者甚至企業(yè)之間搭建各種各樣的合作模式。科研單位與云平臺的合作能加快科研成果的輸出,云平臺可以幫助科研單位進行成果的轉化與應用;臨床研究者可以借助云平臺進行輔助診斷,云平臺通過臨床數(shù)據(jù)的輸入不斷使診斷模型優(yōu)化;企業(yè)通過云平臺可以推廣自有產品,云平臺也可以給用戶提供更多樣的供應商選擇。
可以預見的是,生物信息云計算平臺的強大能力不僅僅會體現(xiàn)在其計算能力上,臨床應用,合作轉化等方面都可以展現(xiàn)其潛力。就讓我們拭目以待看看云計算平臺的發(fā)展吧。