上周四3月31日
人類基因組研究迎來重大突破:
國際科學組織“端粒到端粒”聯(lián)盟
公布了首個人類基因組完整序列
自此
人類基因組序列遺留近20年的
測序結果空白被填補
人類“生命地圖”成功拼成!
人類基因組計劃被譽為生命科學的“登月計劃”,1985年由美國科學家率先提出,1990年正式啟動。其宗旨在于測定組成人類染色體(指單倍體)中所包含的30億個堿基對組成的核苷酸序列,達到破譯人類遺傳信息的最終目的。
2003年,研究人員首次繪制出了人類基因組的圖譜,但受限于當時的技術,尚有約8%的基因序列未完全破譯。如今完整的基因組序列為我們提供了首個解讀人類DNA的全面視角,并將促進對人類生產發(fā)育、疾病的基因研究。
基因檢測
解鎖生命密碼
有這樣一個比喻,如果上帝是程序員,人類基因就是一串串代碼。幾十年來,人類孜孜不倦研究基因探索自身奧秘,基因檢測技術隨之蓬勃發(fā)展。
基因檢測指通過特定設備對被檢測者細胞中的DNA分子信息作檢測,分析其所含有的基因類型和基因缺陷及其表達功能是否正常的一種方法。它不但可以診斷疾病,還能預測疾病風險,受測者可根據檢測結果對疾病進行早期干預,從而防止和延緩疾病的發(fā)生和發(fā)展。
技術進步帶來了檢測成本的下降。如今,關注遺傳隱私的人可以購買DNA檢測試劑盒,借此了解其祖源、血統(tǒng)、罹患某種疾病的風險、是否對酒精過敏、是否攜帶遺傳變異等。
此流程相當簡單——消費者網上下單后收到樣本采集盒,將2ml唾液或使用拭子在牙齦間滾動幾次作為樣本寄回,之后可到APP等相關渠道查看基因檢測結果。
近來在西方發(fā)達國家,家庭基因檢測已形成新風尚,很多人給家人朋友選擇的圣誕禮物就是一支基因測試劑禮盒。不過,家庭基因檢測雖然提供了一種新奇的體驗,但同時也有可能打開潘多拉魔盒——想想有朝一日多年以父子相稱的人,實際上不具有生物學關系是多么可怕的事……
除了消費級基因檢測服務,基因檢測的應用場景還包括面向科研機構、高等院校和藥企的科研級,以及可作為醫(yī)生診斷、治療依據的臨床級應用。
基因測序
下一代改變世界的技術
目前,普遍用于基因檢測的技術大致可以分為四類:
●PCR技術(定性PCR、定量PCR、數(shù)字PCR,新冠病毒核酸檢測主要用的就是熒光定量RT-PCR技術)
●基因芯片技術
●熒光原位雜交(FISH)技術
●基因測序技術
其中,基因測序技術是最為直觀、準確的方法之一,它能對基因序列進行精確、廉價、快速的測定解析,已被廣泛應用于基礎研究、醫(yī)療、工業(yè)、法醫(yī)學等領域。此次科學家首次破譯人類完整基因組序列以及上述家庭DNA測試應用的就是基因測序。
具體而言,基因測序即從血液、體液或細胞中分析測定基因全序列,通過序列分析預測罹患多種疾病的可能性,個體的行為特征及行為合理性,如癌癥,運動天賦、酒量、先天基因攜帶等,被譽為下一代改變世界的技術。
從原理上講,基因測序就是將DNA化學信號轉變?yōu)橛嬎銠C可處理的數(shù)字信號,對基因測序數(shù)據的分析通常分為三個步驟:原始數(shù)據清理、數(shù)據預處理和變異檢測。
基因測序儀產生的數(shù)據分析體量是非常龐大的。如果待測序的樣本有30億個堿基,每個堿基用一個字節(jié)Byte表示,則這個樣本的數(shù)據大小為3GB;如果測序深度為30×,則測序儀輸出的文件≈3*30*2=180GB。
根據測序深度以及添加的附加信息不同,實際測序儀輸出的文件大小從幾百GB到幾TB不等,當測序儀處于全天候工作的情況下,每天產生的數(shù)據量會達到上百TB甚至PB級!
海量基因數(shù)據高并發(fā)處理的計算需求,海量數(shù)據的存儲和比對分析需求,以及高度敏感基因數(shù)據的長期安全保存,無一不給傳統(tǒng)IT帶來巨大挑戰(zhàn)。
戴爾科技
牢鑄基因測序底層架構
為了更好地順應基因測序行業(yè)發(fā)展,戴爾科技集團作為全球醫(yī)療相關行業(yè)主要解決方案提供商之一,專門針對基因測序行業(yè)提供整體解決方案:
1.算力:
高性能服務器集群——戴爾科技的HPC Ready Architecture for Genomics是一款經過測試和優(yōu)化的解決方案,它涵蓋了戴爾服務器、軟件、網絡和存儲,包括各種形式的基因組數(shù)據分析所需的資源,可提高執(zhí)行基因組分析的系統(tǒng)的吞吐量,使組織按照可預測的時間表更快得出分析結果。
2.存儲:
作為經過廣泛驗證的數(shù)據湖解決方案,PowerScale可處理端到端的生命科學業(yè)務系統(tǒng)工作流中普遍存在的各種不同格式、不同大小的非結構化數(shù)據,極大提高基因測序數(shù)據的處理性能和資源利用率,實現(xiàn)快速精準的基因測序工作。
PowerScale的橫向擴展文件系統(tǒng)為應用程序提供了一個高度可用的單卷單文件系統(tǒng),使生命科學工作流程的每一步都可以訪問數(shù)據。無論需求如何變化,PowerScale都能線性擴展性能和容量,且易于管理。
PowerScale由英特爾®至強®處理器提供支持,該處理器采用軟件定義的基礎設施和敏捷云架構,為PowerScale提供了卓越的性能和效率,可加速要求嚴苛的文件工作負載,使企業(yè)發(fā)揮數(shù)據資本的價值,加速業(yè)務的數(shù)字轉型。
目前,全球已有150多家大型測序客戶(包括領先的測序中心、制藥公司和學術研究中心)基于PowerScale進行生命科學研究、醫(yī)學診斷和藥物發(fā)現(xiàn),無論現(xiàn)在還是將來,用戶的存儲需求都將通過PowerScale將得到滿足。
3.數(shù)據保護:
海量的基因測序數(shù)據在分析完成以后面臨長期保存的要求。按照當前基因行業(yè)的監(jiān)管要求和通用方式,測序數(shù)據的保存時間通常在10年以上。
針對基因行業(yè)普遍采用的用于非結構化數(shù)據存儲的NAS存儲方式,戴爾科技提供用于NAS保護的PowerProtect Data Manager純軟件解決方案,可用于NAS資產的集中備份和恢復。
它支持戴爾PowerStore、Unity、PowerScale NAS產品的保護,以及其他供應商(如NetApp、Windows和Linux文件服務器)使用通用NAS的任何NFS或CIFS共享。
隨著人類全基因組完整序列公布,人類對自身的認識將上升到一個新高度。戴爾科技集團將繼續(xù)以完整的端到端的IT解決方案,助力基因測序技術應用,解鎖生命密碼,增進人類健康福祉。