發(fā)現(xiàn)希格斯玻色子,即“上帝粒子”,是近幾十年來最具革命性的物理學發(fā)現(xiàn),那么,歐洲的科學家們是如何做到的呢?從IT的角度看,他們所依靠的是一個優(yōu)秀的、有點兒老派的網(wǎng)格計算基礎架構,雖然一個新的、基于云的計算基礎架構已經(jīng)出現(xiàn)在了地平線上。
歐洲核子研究組織(CERN)已經(jīng)部署了十年之久的網(wǎng)格計算基礎設施在過去幾年間被研究人員廣泛使用,而幫助發(fā)現(xiàn)希格斯玻色子,或所謂“上帝粒子”,也使其一夜成名。
CERN的網(wǎng)格與公有云有很大不同,公有云是把數(shù)據(jù)和資源托管在一個或多個集中管理的數(shù)據(jù)中心,用戶通過網(wǎng)絡連接這些資源,而CERN的網(wǎng)格則是將全球150多個計算站點相互連接,彼此共享信息。
在CERN的網(wǎng)格剛剛建成的時候,它每年處理的數(shù)據(jù)量在15PB到20PB之間。而今年,CERN所處理的數(shù)據(jù)量已經(jīng)超過30PB。CERN的計算網(wǎng)格項目負責人Ian Bird稱,“如果所有數(shù)據(jù)處理量都由CERN自己來做的話,那是肯定不行了。”網(wǎng)格計算其實與如今的云計算非常相似。“從某種意義上說,我們已經(jīng)在云中了,”他說。
發(fā)現(xiàn)希格斯玻色子的大型強子對撞機(LHC)就坐落在CERN的工作場所中,這里是整個研究活動的中心,其網(wǎng)格采用的Tier 0連接。而在LHC長達17英里的隧道里,粒子強烈碰撞所產(chǎn)生的各種實驗數(shù)據(jù)則會通過網(wǎng)格發(fā)送到11個Tier 1站點,這些站點都是擁有大規(guī)模數(shù)據(jù)中心的著名實驗室,可處理海量的科學數(shù)據(jù)。這些站點所產(chǎn)生的數(shù)據(jù)集再分發(fā)給全世界120多家學術機構,供進一步的測試和研究。
整個網(wǎng)格的磁盤容量高達200PB,有30萬顆計算芯片,通過10Gbps鏈路連接了150多個計算中心。“網(wǎng)格將所有這一切連接在一起,使其看上去就像一個單一系統(tǒng)。”絕大多數(shù)站點都安裝了標準的紅帽Linux發(fā)行版,以及定制的存儲和計算界面,每個站點還可提供描繪數(shù)據(jù)的信息服務。
當然,對于希格斯玻色子這樣的里程碑式的發(fā)現(xiàn)做出貢獻的研究并非總是集中管理的。Bird說,事實上這是一個相當混亂的過程,也使得他們很難制定出一個為各個站點的測試工作分配適當數(shù)量計算資源的計劃。舉例來說,在LHC內(nèi)部發(fā)生一次粒子對撞后,受到影響的各種粒子瞬間就會在探測器里消失得無影無蹤。數(shù)據(jù)分析的第一階段就是重建對撞過程,然后跟蹤各種粒子的軌跡,這一工作主要在Tier 0(也就是CERN內(nèi)部)和Tier 1站點上進行。其他階段的分析則被分解為一些更小的數(shù)據(jù)集,分發(fā)給合作的學術機構進行分析。由此開始,大量的統(tǒng)計分析、直方圖分析和數(shù)據(jù)挖掘會隨之進行。如果要做一個發(fā)現(xiàn),分析就應該非常精確,可供重復試驗用。
這也就是為什么Bird和CERN對于云計算的潛力感覺相當興奮的原因。“我們感興趣的是可以使用云存儲,”他說。“不過在這個時點上,我們無法確定使用云的成本,以及它會對我們的資金結構產(chǎn)生何種影響。”CERN主要的資金來源是各種學術機構訪問CERN所生成的數(shù)據(jù)用于分析,并為此支付一定費用。很多這樣的合作學術團體都有自己的計算資源,希望用CERN的數(shù)據(jù)在他們自己的站點上做實驗,讓這些資源能夠在他們的學術社區(qū)上被人使用。“從技術角度看,云模式是可以運行的,只是我不知道如何收費。”
CERN已經(jīng)邁出了跨向云的最初幾步。從內(nèi)部而言,CERN正在運行一個基于OpenStack開源代碼的私有云。很多合作組織也都在自己的站點上構建了私有云。
今年3月,CERN和另外兩家歐洲研究機構還構建了一個公有云,叫做Helix Nebula,也叫科學云。這是研究機構、云廠商和IT支持企業(yè)共同合作的結果,可以看成是用于科研社區(qū)的一朵社區(qū)云。CERN最近已經(jīng)啟動了兩年期的試驗計劃,可在Helix Nebula云中仿真LHC的實驗。
Bird對云計算充滿了希望,認為下一個十年,云就是現(xiàn)在的網(wǎng)格。“只是如何實現(xiàn)這一點尚不明朗。”不過即便云計算充滿了挑戰(zhàn),Bird還是堅信,能從事上帝粒子這樣重大科學發(fā)現(xiàn)的科學家們也肯定能夠理解并掌握云計算。