摘要:在 @Scale 年度會議上,Facebook 工程副總裁 Jay Parikh 說,拆散一個數據中心比將其重新組裝起來更容易,而該公司 SWAT(代表災難特種武器和戰術團隊) 團隊執行的定期壓力測試正讓該公司軟件工程師在重新組裝這部分變得更好。
Jay Parikh將這項工作稱為 Project Storm,始于2012年的 Sandy 颶風,Sandy 颶風威脅到了2個Facebook數據中心,雖然最終颶風沒有對數據中心造成損害,但這一事件促使該公司的工程團隊考慮突然損失一個或多個數據中心的情況下Facebook全球服務受到的影響。
該公司召集了一個SWAT團隊去尋找答案。2014年, Project Storm進行了一項真實世界的測試:干掉一個數據中心觀察流量是否能順利轉移。