引言:
看過電影《蜘蛛俠》都會記住一句臺詞
“能力越大,責任越大”
男主角因為基因突變由弱小變強大
雖然是虛構的故事
但是人們對于身體的深度發掘
確實一直在進行
當今科技的發展
人們通過基因的研究
雖說沒有向科幻片表現的那么神奇
但是通過基因檢查第一時間查找
人類的一些疾病
目前取得了巨大的進展
基因測序要求超級硬件做后盾
但是基因組需要幾十億個標記,如果每秒列出一個數字,需要花 96 年才可以數到 30 億。但是基因檢查需要對著30億標記進行至少上30次以上的檢測。這樣算下下來幾千年都檢測不出。這就需要計算能力超強的高性能計算集群,來幫助專家來研究解決各種病因的基因檢查。正是應了那句臺詞“能力越大,責任越大”。
翻譯基因組研究院(TGen) 就是針對神經母細胞瘤試驗的下一代基因組測序技術,這些測序技術產生了大量的數據,為了及時處理這些信息,TGen 需要構建一個新的 HPC 集群。
戴爾為TGen帶來的蛻變
為了克服這些挑戰,TGen 采用了Dell PowerEdge M710HD 刀片服務器集群。刀片服務器運行 CentOS Linux,它們被安置在三個 Dell M1000e 模塊化刀片服務器盤柜中。Dell Force10 C300 和 S4810 10-Gigabit 交換機為集群的 800 個核心提供連接。“我們選擇 Dell Force10 交換機是因為它們的每端口成本和無阻塞性能,”Lowey 說。“從我們原有的 Cisco CLI 遷移到 Dell Force10 網絡設備可以說一點也不麻煩。”
對于數據存儲,TGen 構建了一個多層次解決方案,它結合了 Dell Fluid Data架構中的多種技術。“我們將擁有基于Dell 的文件系統,支持高速的并行文件訪問,”Lowey 解釋說。“Dell Compellent 存儲將支持更多傳統應用程序,如 Microsoft SQL Server 數據庫和實驗室的文件共享。最后,我們期望利用 Dell DX Object Storage Platform 進行數據歸檔。我們對 Dell DX 平臺感到很興奮,因為每 TB 的成本使得我們可以經濟實惠地存儲大量的數據,將數據量擴展到 PB 級,并且,平臺將元數據與數據本身一起存儲,這樣的方式將使我們能夠利用高級工具來挖掘我們龐大的數據集。
此性能提高對患者可能是生死攸關的。“我們采取分而治之的方法來處理數據,”Corneveaux 說。“我們可能會將 1 個 TB 分割成 1,000 個不同的作業,讓它們在Dell 集群上分開運行,最后將它們全部重新合并在一起。將處理一個基因組的時間縮短了幾天,甚至幾周。我們在和可能 5 歲前就會死亡的患者打交道,所以幾天也極為重要。如果我們能夠幫助醫生將正確的藥物開給患者,我們就可以幫助讓這種疾病好轉。如果沒有我們在這里已經建立的架構,這將是完全不可能的。”
此外,HPC 集群讓 TGen 能夠應對新的數據分析挑戰。“我們現在可以解決更大的問題,”TGen 的神經基因組學助理教授 Matt Huentelman 說。“對于患有惡性癌癥的病人來說,更重要的是,我們可以克服具有高時效要求的問題。在過去,要求即時結果的問題是禁地。我們有一條用于分析數據的路徑,但我們知道結果不可能及時返回來給予幫助。現在我們可以深入探究當天就需要回答的問題。”
蜘蛛俠變身:一個管理員管理 800 個服務器核心
總而言之,集群的最高性能是八萬億次浮點運算。“我們處理患者數據的能力提高了 12 倍,”Lowey 說。
TGen 使用在基于 VMware 的虛擬平臺上運行的 Dell OpenManage 來管理Dell 刀片服務器。“對我們的多臺刀片服務器實現單點管理,這大大簡化了管理工作,”Lowey 說。“一個人就可以輕松管理我們的 800 個核心,而在此之前,我們將需要至少兩個人來做同樣的工作。”
能力越大 責任越大 攜手拯救生命
現在,Dell 正在幫助 TGen 解決長距離通信的挑戰。“我們在研究項目中與來自世界各地的組織的許多不同專業人才合作,”Suh 說。“除了患者以外,我們還與臨床醫生、病理學家和從患者身上收集樣本的其他人合作。生物學家解剖樣本。基因學家對樣本應用最新的基因組學技術,而生物信息學家則破譯數據。在設計臨床研究框架時,我們與生物統計學家、計算機科學家和軟件工程師合作。我們需要一個高吞吐量的環境,所有這些人都可以用它來協同工作。”
TGen 和 Dell 正在開發一個基于云的協作系統來促進這種互動。“該項目的目標是實現長期對象存儲、站點之間的快速數據傳輸,以及從患者到生物信息科學家、試驗管理人員的透明,”知識計算架構師 Preston Lee 說。
“Dell 與我們并肩合作來交付解決方案,”Mousses 說。“有一個愿意挽起袖子幫助我們解決一些最棘手的 IT 問題的合作伙伴在身邊,是非常難能可貴的。”
Lowey 補充說:“Dell的工程師和架構師已經反復證明了他們是一群最聰明的技術人才。不管我有什么問題,每當我致電 Dell 時,我都相信自己會得到一個滿意的答復。當我們提出問題時,Dell 支持服務人員總是會迅速而有效地予以答復,并且 Dell 卓越的HPC技術和整體方案正在幫助我們構建一個十分高效且易于管理的系統。”
小結:
可以看到,戴爾端到端解決方案不僅讓基因組研究院如虎添翼。同時因為戴爾本身基因的不斷強大,也讓戴爾在幫助用戶實現價值的能力越來越強。正是印證了那句話“能力越大、責任越大”。