云計算正在成為生物醫學界的“寵兒”。——8月14日,北京貝瑞和康生物技術有限公司與阿里云共同向外界宣布雙方達成合作,共同打造以海量的中國人群基因組數據為核心的數據云,實現對個人基因組數據的精準解讀。
此次,雙方共同合作的“神州基因組數據云項目”將首先聚焦于基因組大數據在云平臺上的批量計算、分析、存儲,進而在基因大數據領域共同進行前沿探索。
“打造基因組大數據,相當于建立了一個中國人基因版的《本草綱目》,將記載中國人群最核心的基因信息、生命信息,為中國人群重大疾病的預測、預防、診斷和治療奠定基礎。它的意義將不亞于《本草綱目》這部東方醫藥巨典。”貝瑞和康首席生物信息官于福利博士說。
中國是世界出生缺陷率最高發地區之一。每年1600萬至2000萬的出生人口中,有80萬至120萬出生缺陷兒。1996年到2010年,中國新生兒出生缺陷發生率增幅達70.9%,每一萬名新生兒中就有149.9人患有先天性缺陷。
這一不利的局面將隨著“神州基因組數據云”項目的實現得到改觀。據了解,貝瑞和康自主構建的中國人群基因組大數據庫目前已包含超過四十萬份基因組數據。通過對該數據資源的深入挖掘,能夠進一步揭示中國人群遺傳突變分布,這將極大助益于提升中國人遺傳疾病診斷的效率和精準程度。
貝瑞和康作為國際領先的基因測序技術臨床轉化服務商,致力于為臨床醫學疾病篩查和診斷提供“無創式”整體解決方案,是無創DNA產前檢測和針對腫瘤循環DNA的腫瘤個體化醫療基因檢測的行業領導者。
基因測序是一種新型基因檢測技術,能夠從血液或唾液中分析測定基因全序列,預測罹患多種罕見疾病的可能性,如地中海貧血病。
業內人士指出,隨著下一代基因測序、生物質譜和醫學成像等醫學技術的迅猛發展,大數據浪潮為生物醫學帶來了前所未有的機遇,將根本性的改變生物醫學基礎研究和醫療實踐,但同時生物醫學領域數據爆炸式的增長也對海量數據的存儲和分析提出新的挑戰。云計算將大量計算資源、存儲資源和軟件資源虛擬化,形成規模龐大的共享資源池,可以有效解決生物醫學對IT資源的彈性需求。
目前,新一代基因測序技術要得到比較準確的信息,一般認為 30X 的基因測序深度是必須的,所以一個人的基因組檢測大約需要產生 90Gb 的數據。如此大的數據,在一般的電腦或小型服務器上運行起來非常困難。
阿里云是全球領先的云計算服務平臺??蛻敉ㄟ^阿里云,用互聯網的方式即可遠程獲取海量計算、存儲資源和大數據處理能力。根據IDC調研報告,阿里云是國內最大的公共云計算服務提供商。
此次,阿里云與貝瑞和康達成合作,正是基于阿里云批量計算服務的強大能力,利用云計算的優勢降低成本,提高數據分析的速度。
阿里云批量計算服務是一種適用于大規模并行批處理作業的分布式云服務,適用于生物基因分析、渲染、多媒體轉碼、科學計算、金融保險分析等多個行業領域。
阿里云高級專家林河山介紹說,“借助批量計算服務,用戶可以調動海量計算資源快速完成基因大數據的處理。批量計算服務提供簡單易用的API,允許用戶通過有向無環圖的方式靈活組建工作流,計算資源管理、作業調度和數據分發由系統自動完成。同時,批量計算服務支持自定義鏡像,并允許應用通過網絡文件系統(NFS)協議高效訪問阿里云對象存儲(OSS)上的數據,使得用戶原有分析流程可以輕松上云。結合阿里云對象存儲,批量計算服務能夠幫助生物信息分析專家在云上快速構建大規?;蚪M學應用。”
他進一步說,“此次與貝瑞和康的合作,阿里云將不斷優化基于基因組學的云解決方案,以契合醫學時代發展的需求。”
業內專家預計,雙方合作完成的基因組數據云將對中國臨床醫學的精準診斷,預防和治療的發展產生深遠的推動力。
無疑,借助阿里云的批量計算服務,用戶將更便捷、更簡單、更迅速完成基因大數據計算,大大降低客戶的成本。同樣,因為云計算的賦能,為研究人員開展大規模的基因組學研究大開“方便之門”,將催生一批影響人類健康相關的變革性成果。