CERN(即歐洲核子研究中心)的大型強子對撞機在接近光速的條件下去撞擊粒子時會創造出另一種更小的微粒,研究人員可以從中推測宇宙誕生時的情況、從而掌握其活動本質。物理實驗同時也創造出大量數據,世界各地的物理學家都要以此為基礎進行自己的研究工作。
Tim Bell是CERN的基礎設施主管,他最初曾以Unix內核開發人員的身份為IBM效力,而后又進入德意志銀行處理基礎設施方面的工作。目前他已經為歐洲核子研究中心工作了八年,他和他的技術團隊每天需要確保超過11000名物理學家能夠用上運作順暢的操作系統、郵件以及安全基礎設施功能。此外,他們也開始審查云計算資源,希望借助這股新技術之風讓海量數據的可管理性變為現實。
“在物理學家嘗試揭示物質與宇宙本質的研究過程中,數據處理能力已經成為一種至關重要的工具,”Bell指出。“只有能夠迅速分析大量數據,物理學家們才能夠將觀察到的結果真正轉化為學術成果。”
CERN在瑞士日內瓦周邊的園區中擁有11000臺服務器,這些設備負責初步處理粒子碰撞實驗的結果數據,并將數據發送至世界各地的小型中心處。這套設施首先將每秒6億個粒子的碰撞活動縮減至60000個,這樣才能讓目前的計算資源有能力對其加以處理。最后,技術人員會從中選出600個值得關注的粒子,從而進一步觀察其活動狀況。盡管經過這樣的層層篩選,該設施每年新增數據存儲量仍然達到25PB左右。
去年,CERN在布達佩斯建立了第二套主數據中心,目前已經容納有約一千臺服務器,但當時該機構并沒有足夠的人手支援新中心的運轉。為了解決這一難題,Bell決定像其它機構那樣將大型數據中心與云計算作為應急方案。如今CERN數據中心的資源由OpenStack負責管理——物理學家們可以利用這款開源程序通過請求使用內存及存儲空間等資源。Bell同時也是OpenStack董事會的成員之一。
“它允許物理學家通過Web界面提起申請,并在2到10分鐘內得到一臺新設備,”Bell告訴我們。“此前在申請物理軟件時,他們往往需要等待幾個月。概括起來,現在的流程就是:有了靈感、申請資源、起身去喝杯咖啡、回來時資源已經調配就緒可以使用了。”