數(shù)據(jù)中心設(shè)計者無法自行評定Uptime、TIA、LEED或其他認(rèn)證級別是有原因的。
Uptime Institute級別目的是為了描述設(shè)施已經(jīng)實(shí)現(xiàn)和沒有實(shí)現(xiàn),可能對數(shù)據(jù)中心冗余與故障停機(jī)時間造成的影響。Uptime等級是評估數(shù)據(jù)中心設(shè)計建造的可靠性與可用性級別的切實(shí)方法。
然而,Uptime級別因不同數(shù)據(jù)中心設(shè)計者而有不同的解釋。因此,自稱的類似設(shè)計認(rèn)證,實(shí)際缺乏可靠支持。合法的數(shù)據(jù)中心認(rèn)證需要經(jīng)過Uptime Institute的嚴(yán)格審查才能獲得。
其他數(shù)據(jù)中心設(shè)計認(rèn)證也按照相同方式運(yùn)作,如LEED(Leadership in Energy and Environmental Design)的金、銀和白金級設(shè)施認(rèn)證。設(shè)計師可以根據(jù)項(xiàng)目情況評估自己的LEED得點(diǎn),但驗(yàn)證與真正的LEED認(rèn)證只有U.S. Green Building Council能夠頒發(fā)。
為什么說的和實(shí)際不一樣?
Uptime Institute數(shù)據(jù)中心等級基于設(shè)施中最薄弱的一個環(huán)節(jié)。因此,即使是該設(shè)施擁有四級能源能源與冷卻組件冗余——雙不間斷電源、水冷機(jī)組、配電設(shè)備、機(jī)房空氣處理器以及四級雙主動配電路徑,如果只有單一管道路徑,也只能獲得Uptime二級認(rèn)證。
許多數(shù)據(jù)中心設(shè)計師對這種僵化和專有的做法感到不滿。設(shè)計師可能會認(rèn)為單管在關(guān)鍵任務(wù)負(fù)載數(shù)據(jù)中心已經(jīng)足夠強(qiáng)大;第二條管并不是必須達(dá)到的可靠性目標(biāo)。因此,對設(shè)計師來說,數(shù)據(jù)中心應(yīng)該能夠獲得Uptime四級認(rèn)證。
數(shù)據(jù)中心設(shè)計者往往因?yàn)樽约涸陬A(yù)算、空間限制以及之前的失敗經(jīng)驗(yàn)而妥協(xié)。例如,某個具備高度能源冗余的數(shù)據(jù)中心發(fā)生了冷卻故障,因?yàn)閿?shù)據(jù)中心經(jīng)營者對冷卻冗余預(yù)算非常苛刻,卻對電力系統(tǒng)不惜成本。這樣宣稱的Tier III Plus或Near Tier IV數(shù)據(jù)中心設(shè)計級別是Uptime Institute明確否定的。設(shè)施好壞只取決于其最薄弱的環(huán)節(jié)。Uptime只會將如何真正地達(dá)到可用性目標(biāo)作為認(rèn)證標(biāo)準(zhǔn),并確保任何修改都是在標(biāo)準(zhǔn)級別內(nèi)。
TIA vs. Uptime Institute
不同數(shù)據(jù)中心設(shè)計認(rèn)證的出現(xiàn),試圖取代Uptime認(rèn)證等級,但并沒有真正的流行起來。
電信工業(yè)協(xié)會(TIA)942-A標(biāo)準(zhǔn)發(fā)布了級別附加內(nèi)容,但實(shí)際用途是評估數(shù)據(jù)中心布線。附加標(biāo)準(zhǔn)F中闡述了Uptime Institute的基本定義。為了清楚地說明數(shù)據(jù)中心設(shè)計認(rèn)證級別,Uptime采用羅馬數(shù)字(級別I、II、III和IV),而TIA使用阿拉伯?dāng)?shù)字(級別1、2、3和4)。
這種方法更容易讓設(shè)計人員根據(jù)不同標(biāo)準(zhǔn)來評估與分類數(shù)據(jù)中心基礎(chǔ)設(shè)施各部分的耐用性。然而,TIA級別并不將數(shù)據(jù)中心作為一個整體來評估可靠性和可用性。Uptime Institute認(rèn)為TIA-942-A部分分類不合法,而且對確保長期可靠性與停機(jī)時間沒有任何價值。
設(shè)計認(rèn)證要求的內(nèi)容
獲得等級認(rèn)證只需要冗余組件——額外的能源供應(yīng)、空調(diào)和水泵,對嗎?事實(shí)并非如此。如果沒有安置在適當(dāng)?shù)奈恢茫瑳]有注意它們?nèi)绾芜B接、安裝和標(biāo)記,冗余組件不會增加任何可靠性。
不同級別的設(shè)計核心區(qū)別在于可同時維護(hù)的能力:數(shù)據(jù)中心在不影響計算機(jī)系統(tǒng)情況下維護(hù)所有系統(tǒng)組件的能力。
冗余組件經(jīng)常會被以某種容易讓設(shè)施出現(xiàn)故障的方式安裝。安裝選項(xiàng)同樣還可能限制設(shè)施能力或在維護(hù)時對數(shù)據(jù)中心關(guān)鍵計算負(fù)載造成影響。其他常犯的錯誤包括定位控制和閥門在緊急時刻非常難訪問,或者組件標(biāo)簽設(shè)置不合理與規(guī)劃失誤。未經(jīng)確認(rèn)的設(shè)計決定可能會把運(yùn)營推入失敗的陷阱,而這些問題是可以避免發(fā)生的。
TIA 942-A標(biāo)準(zhǔn)警告:“了解哪些可能影響數(shù)據(jù)中心運(yùn)營風(fēng)險的行為十分重要,不論它們是故意或偶然時間,還是自然行為。數(shù)據(jù)中心設(shè)計者、管理員和經(jīng)理需要在兩個方面進(jìn)行重點(diǎn)評估,一方面盡可能減少危害設(shè)施的情況發(fā)生,一方面要做好應(yīng)急預(yù)案。”
打造具有認(rèn)證等級的數(shù)據(jù)中心
無論數(shù)據(jù)中心設(shè)計是否通過Uptime或TIA級別認(rèn)證,真正關(guān)鍵的建筑設(shè)計任務(wù),需知識淵博的團(tuán)隊(duì)協(xié)作,以免重蹈覆轍。
如果系統(tǒng)為滿足認(rèn)證等級而犧牲有效性或有用性,認(rèn)證體系就被錯誤使用了。如果宣傳已經(jīng)達(dá)到三級或四級容錯的數(shù)據(jù)中心出現(xiàn)故障,尤其是承載大規(guī)模云服務(wù)的設(shè)施,那么會有很多的用戶受影響,數(shù)據(jù)中心運(yùn)營商通過的認(rèn)證將變得毫無意義并可能失去企業(yè)用戶。
構(gòu)建滿足指定性能需求,而不考慮通過Uptime、TIA、LEED的US.Green Building Council或其他組織認(rèn)證的數(shù)據(jù)中心設(shè)計其實(shí)是可行的。然而,專業(yè)的設(shè)計團(tuán)隊(duì)、更詳細(xì)的設(shè)計文檔和雇傭工程監(jiān)理,都會花掉跳過認(rèn)證后所節(jié)省的時間與成本。同行評估可以被作為認(rèn)證評估過程的替代方案,找出潛在停機(jī)風(fēng)險,用更現(xiàn)實(shí)靈活的方式處理,而不是按照認(rèn)證的死板要求實(shí)現(xiàn)。
Uptime Institute要求所有目標(biāo)在開始之前,必須根據(jù)實(shí)際預(yù)算進(jìn)行設(shè)置,停機(jī)時間因?yàn)轭A(yù)算削減所產(chǎn)生的影響,是可以理解并在預(yù)期范圍內(nèi)。這就是為何沒有通過嚴(yán)格認(rèn)證就宣稱自己通過設(shè)計等級不合法的原因。無論你是否通過認(rèn)證,等級排名會被同行作為一種通信方式加以利用。