云計算正在成為生物醫學界的“寵兒”。近日,北京貝瑞和康生物技術有限公司(下稱“貝瑞和康”)與阿里云共同向外界宣布雙方達成合作,共同打造以海量的中國人群基因組數據為核心的數據云,實現對個人基因組數據的精準解讀。
兩巨頭合力欲建國人基因組大數據
“打造基因組大數據,相當于建立了一個中國人基因版的《本草綱目》,將記載中國人群最核心的基因信息、生命信息,為中國人群重大疾病的預測、預防、診斷和治療奠定基礎。它的意義將不亞于《本草綱目》這部東方醫藥巨典。”貝瑞和康首席生物信息官于福利博士說。
中國是世界出生缺陷率最高發地區之一。每年1600萬至2000萬的出生人口中,有80萬至120萬出生缺陷兒。1996年到2010年,中國新生兒出生缺陷發生率增幅達70 .9%。這一不利的局面將隨著“神州基因組數據云”項目的實現得到改觀。據了解,貝瑞和康自主構建的中國人群基因組大數據庫目前已包含超過四十萬份基因組數據。通過對該數據資源的深入挖掘,能夠進一步揭示中國人群遺傳突變分布,這將極大助益于提升中國人遺傳疾病診斷的效率和精準程度。
貝瑞和康C E O周代星告訴南都記者,一個人有300多萬個位點突變,這些突變哪些是有意義的,哪些是沒有意義的,中國截至目前還沒有這樣詳細的圖譜。而貝瑞和康與阿里云合作,就是希望建立中國人易感位點的數據庫。而一旦這一數據庫建成,這對于7000多種臨床疾病的解讀將有積極意義。
牽手背后是基因云計算熱
據南都記者了解,新一代基因測序技術要得到比較準確的信息,一般認為30X的基因測序深度是必須的,所以一個人的基因組檢測大約需要產生90G b的數據。如此大的數據,在一般的電腦或小型服務器上運行起來非常困難。
而要對40萬個樣本進行計算,這對計算能力要有非常高的要求,而阿里云正好能提供這樣的計算和分析能力。
阿里云高級專家林河山在接受南都記者采訪時表示:雙方合作第一階段主要是提供存儲、計算資源、方便使用;第二個階段,在協商一致的情況下,可能會探討利用大數據展開合作,讓數據工具與醫療相結合。林河山稱,阿里大數據方面已經通過天貓醫藥館和阿里健康有了較好的積累,將有助于雙方第二階段合作。
“云計算介入基因檢測有著巨大的潛力,以美國為例,就已經有比較成功的先例。比如谷歌旗下的DNANEXUS以及七橋基因公司等在云上提供生物信息服務的公司。”林河山如是說。
至于項目商業化路徑,貝瑞和康C E O周代星坦言,目前主要是針對醫療機構。據他透露,國內有20多家醫院已經被批準可以做遺傳基因的檢測,而檢測需要更好的解讀,這就是“神州基因組數據云項目”較為顯而易見的價值所在。
業內人士指出,隨著下一代基因測序、生物質譜和醫學成像等醫學技術的迅猛發展,大數據浪潮將根本性的改變生物醫學基礎研究和醫療實踐。