大多數數據中心都是精心設計而成的,很多人都誤以為這樣的數據中心只要追求高功效低能耗之外就可以了。因此,人們往往會忘記干凈、清潔的環境對于數據中心有著重要的意義。有些數據中心甚至可能會因為戶外顆粒或氣體污染物的進入而處于有害環境中,在一些情況下,污染物還有可能形成于數據中心內部。為了避免數據中心的管理者們忘記這么重要的一點,今天我們就數據中心環境問題進行簡單的探討。
空氣污染物對數據中心造成的影響主要分為三類:化學影響、機械影響和電學影響。電路板中的銅蠕變腐蝕和小型表面安裝組件中的鍍銀腐蝕是兩種常見的化學故障。機械影響包括散熱片污染、光信號干擾、摩擦力增大等,電學影響包括電路阻抗和電弧的變化等。請注意,縮小電路板功能部件的尺寸并實現組件的小型化是改善硬件性能的必要條件,但是也會使硬件更易受到數據中心環境中的污染物的影響。制造商們一直致力于在不斷縮小功能部件尺寸的同時維持硬件的可靠性,卻又無需采取額外的高成本措施來加強所有的IT設備。他們的大多數IT設備都并非安裝在腐蝕性環境中,腐蝕性環境會使設備面臨更高的故障風險。
通過監控數據中心的粉塵和氣體污染物來維持硬件的可靠性,這是數據中心管理員的職責,數據中心的清潔程度必須達到ISO14644-18級的標準。一般而言,只要采用以下所列的相應過濾方案,就能達到這樣的清潔級別:
1.可按ANSI/ASHRAE標準127-2007"Methodof Testing for Rating Computer and Data Processing Room Unitary Air Conditioners"中的建議,使用MERV8過濾器不斷地過濾室內空氣;
2.可按標題為"ParticulateandGaseousContaminationinDatacomEnvironments"的ASHRAE書籍中的建議,使用MERV11或MERV13過濾器過濾進入數據中心的空氣。應當減少數據中心內部的粉塵源。
氣體污染物應符合已修改的ANSI/ISA-71.04-1985安全級別G1,以滿足以下條件:
1.銅反應率低于300C/月,
2.銀反應率低于300C/月,對于含有大量氣體污染物的數據中心,強烈建議對進入數據中心的空氣及數據中心內部的空氣進行氣相過濾。要維持IT設備的高度可靠性,并避免保修范圍以外的硬件更換成本,請遵守此處所列的要求,這一點至關重要。
空氣粉塵由粉塵引起的故障包括(但不局限于)以下幾種(ASHRAE2009a):
機械影響
這些影響包括阻礙冷卻氣流、干擾移動部件、磨損、光干涉、互聯干擾、表面變形(例如,磁性媒體)以及其他的類似影響;
化學影響
落在印刷電路板上的粉塵會導致組件腐蝕和/或臨近的相隔功能部件短路;
電學影響
這些影響包括阻抗變化和電子電路導體發生橋接。
粉塵無處不在,即便采取最好的過濾措施,數據中心內還是會有粉塵。這些粉塵會落在電子硬件上。幸運的是,大多數粉塵都是無害的。只有在少數情況下,粉塵才會侵蝕電子硬件。
一般而言,數據中心內的有害粉塵中均含有大量離子,比如氯鹽。這些有害粉塵主要來自直徑為2.5-15μm的室外粗塵以及直徑為0.1-2.5μm的室外微塵(Comizzoli1993)。粗塵顆粒中包含各種礦物性和生物性污染物(大多是因風蝕而形成的),可在空氣中停留數日。微塵顆粒一般是由礦物燃料燃燒以及火山活動所形成的,可在空氣中停留數年。各種巨大的鹽水體也是數據中心空氣粉塵污染物的一個主要來源,沿海地區的強風可將海鹽向內陸方向吹進10公里(6英里)或者更遠,而這些海鹽能夠毀壞這一范圍內的電子設備(Bennett1969;Crossland1973)。
從環境中吸收濕氣是粉塵損害印刷電路板可靠性的途徑之一。濕塵中的離子污染物會降低印刷電路板表面的絕緣阻抗,更糟糕的是,它們還會通過離子遷移導致臨近的相隔功能部件短路。
潮解相對濕度是指,粉塵吸收足夠的水分變濕從而導致腐蝕和/或離子遷移時的相對濕度,這一濕度決定了粉塵的腐蝕性。當粉塵的潮解相對濕度高于數據中心的相對濕度時,粉塵處于干燥狀態,不會造成腐蝕或者離子遷移。然而,在少數情況下,當粉塵的潮解相對濕度低于數據中心的相對濕度時,粉塵就會吸收濕氣而變濕并導致腐蝕和/或離子遷移,從而降低硬件可靠性。Comizzoli等人在1993年所進行的某項研究顯示,在全球各地,由停留在印刷電路板上的粉塵而引起的泄漏電流都會隨著相對濕度的提高而呈現指數級的增長。這項研究使我們得到了以下結論:將數據中心的相對濕度保持在60%以下,這樣可以將由停留的微塵而引發的泄漏電流保持在可接受的次μA級范圍內。
少數情況下,數據中心內部也可能會產生有害粉塵。增濕器會通過蒸發空氣中的水滴來提高室內濕度,如果加入增濕器的水含鹽量高,而這些鹽的潮解相對濕度又低于數據中心的相對濕度,就可能造成有害的室內粉塵污染。即使這些鹽的濃度很低,也會造成嚴重的腐蝕和離子遷移威脅。通過使用逆向滲透法(ASHRAE2009a)來處理增濕器中的水,可以緩減這些與增濕器相關的腐蝕問題。
來自紙張、硬紙板或者紡織品的纖維性粉塵會污染散熱片,并中斷設備的冷卻過程。數據中心操作員應避免在數據中心內大量使用這些材料。例如,新設備應在數據中心外拆箱,應將大量的打印機放置在其他位置。總的說來,大多數粉塵都是無害的。
少數情況下,當停留的粉塵的潮解相對濕度低于數據中心的相對濕度時,就有可能出現腐蝕和/或離子遷移問題。一般而言,數據中心的相對濕度必須保持在60%以下,以避免任何灰塵腐蝕硬件。鋅晶須是顆粒污染物對硬件可靠性造成嚴重危害的另一種途徑,它是數據中心內最常見的導電顆粒。
為了防止腐蝕,一些高架地板鋼磚的底部都會鍍上鋅。支撐鋼磚的縱梁和基座也會鍍上鋅。這些鋅可能是通過電鍍或熱浸鍍鋅方式鍍上去的。盡管鋅晶須在這兩種鍍鋅方式下都有可能出現,但是電鍍鋅上更易產生晶須(Brusse2004;Lahtinen2008)。有時,鋅晶須可長達1至2毫米,在拆卸鋼磚或拉動/拆卸地下電纜時,鋼磚會被弄亂,這時鋅晶須可能會發生移動并暴露在空氣中,從而威脅到IT設備。如果IT設備吸入鋅晶須,電壓高于25V的電路中可能會出現短路,電弧,信號紊亂或者災難性故障(Miller2007)。
有一種非常簡單的鋅晶須探測方式,這就是使用手電筒。拆下一塊高架地板磚,將其立于光線較弱的區域中。打開手電筒,以45°角掃射鋼磚底部。在亮光中閃爍的小斑點可能就是鋅晶須。為了確認是否存在鋅晶須,應當使用碳膠標簽收集標本并在掃描電子顯微鏡(SEM)下查看。如果存在鋅晶須,就應當采取補救措施,其中包括更換被污染的高架地板磚并聘請專業人士對數據中心進行清理。ISO14644-1已成為全球性的首要標準,用于根據空氣中的顆粒濃度對空氣清潔程度進行分級。
氣體污染物含硫氣體(如SO2和H2S)是數據中心內導致硬件腐蝕的最常見氣體(Rice1981)。ANSI/ISA-71.04-198已發布了氣體成分的環境限制。這些限制對于確定數據中心環境清潔度有著指導作用,但是,出于某些原因,對于測量腐蝕性或預測數據中心環境中的硬件故障率,它們卻沒有任何幫助。
首先,確定氣體成分并不是一項簡單的任務。
其次,一般來說,通過氣體成分來預測腐蝕速率也不是一項十分直觀的工作。氣體間的協同作用會讓情況變得更加復雜。例如,經證實,二氧化硫或氫化硫本身對于銀或銅并沒有十分強的腐蝕性,但是當它們同其他氣體(如二氧化氮和/或臭氧)結合后,就會對銀和銅產生強烈的腐蝕性(Volpe1989)。相對濕度對于銅的腐蝕速率有很大的影響,而銀的腐蝕速率卻與濕度無關(Rice1981)。
如ANSI/ISA-71.04-1985標準所述,要確定數據中心環境內的氣體腐蝕性,有一種十分簡便的量化方式,即所謂的"反應式監測法".該方法會將銅試樣置于該環境中一個月,然后使用庫倫還原法來分析腐蝕產物的厚度及化學性質。
但是,僅使用銅試樣存在兩個主要限制:
第一,對于會強烈腐蝕許多金屬的污染物氯而言,銅并不十分敏感;
第二,銅的腐蝕度對于相對濕度又過于敏感。使用銀試樣有利于區分氣體污染物與相對濕度對腐蝕性造成的影響。
如果結果表明,相對濕度對于腐蝕過程有顯著的影響,那么只需降低數據中心的相對濕度,就能降低腐蝕性。現在通行的方法是同時使用銀試樣和銅試樣,以便更好地了解環境中腐蝕氣體的化學性質。表2:按ANSI/ISA-71.04-1985劃分的氣體腐蝕性等級嚴重等級銅的反應等級描述G1300C/月環境得到了良好的控制,腐蝕性不是影響設備可靠性的因素。溫和G2300-1000C/月環境中的腐蝕影響可以測量,其可能是影響設備可靠性的一個因中等素。G31000-2000C/月環境中極有可能出現腐蝕現象。較嚴重GX>2000C/月只能在該環境中使用經過特殊設計和封裝的設備。
目前,ANSI/ISA-7104-1985標準僅適用于銅腐蝕,然而正如上文所述,最好同時使用銅和銀試樣,以對數據中心的腐蝕性進行分級。換言之,對于一個被歸入G1級嚴重等級的數據中心而言,銅和銀的腐蝕速率限值不應超過300C/月。只有很少數的問題數據中心的銅腐蝕速率大于100C/月;而所有這些問題數據中心的銀腐蝕速率都大于100C/月。
請注意,在這31個站點中,銀腐蝕速率通常要比銅腐蝕速率高出一個數量級或更多。這項調查只針對已報告了硬件故障的數據中心,它清楚地指明了,銅腐蝕速率并不是硬件故障可能性的良好指標。要更好地根據銅銀腐蝕速率來預測腐蝕相關故障,就需要對數據中心進行隨機抽查,不論其是否出現過腐蝕相關故障。ANSI/ISA-71.04-1985是一個成熟且已被廣泛接受的標準,它規定G1級嚴重等級的銅腐蝕速率應低于300C/月,這一數據說明"環境溫和并得到了良好的控制,腐蝕性不是影響設備可靠性的因素".。
數據中心的氣體污染物級別會受到位置及時間的影響。有利于監測氣體腐蝕性的位置位于,機架進氣口側前方2英寸(5cm),離地面1/4及3/4機架高度處。理想情況下,應當進行全年監測,但隨著數據中心歷史記錄的增多,可以只對已知的氣體污染物處于高級別的月份進行監測。
反應式監測法要求將銅銀試樣暴露在外一個月,以便準確地測量環境腐蝕性。對于配有空氣側節能裝置的數據中心,需要進行實時監測,以對數據中心的外部事件做出迅速反應;這些外部事件可能會釋放出腐蝕性氣體,而這些氣體可能會流入數據中心。現在,共有兩種市售的實時反應式監測器可供選擇。其中一種使用石英晶體微量天平來測量腐蝕產物質量增長速率。另一種則通過測量金屬薄膜阻抗的增長速率來確定氣體的腐蝕性。氣體的腐蝕性變化可通過實時探測得到,這樣就能采取各種預防性措施,如防止外界腐蝕性空氣進入數據中心。
對數據中心的氣體進行氣相過濾對于不符合已修改的ANSI/ISA-7104-1985銅銀腐蝕G1級嚴重等級的數據中心,建議進行氣相過濾。應對進入數據中心的氣體進行氣相過濾,以防止氣體污染物進入數據中心。進氣口的鼓風機可用來為數據中心增壓,以避免受污染的室外空氣滲入數據中心內部。還應通過氣相過濾器對數據中心內的空氣進行反復循環,以除去數據中心內部生成的污染物。建議您通過這些措施使氣體污染物等級符合已修改的ANSI/ISA-7104-1985銅銀腐蝕G1級嚴重等級。
2008年ASHRA數據通信設備環境指南為了提高設施操作的靈活性,尤其是朝著減少數據中心能耗的目標邁進,SDHRAETC9委員會修訂了這些建議的設備環境規范,尤其是1級和2級的建議范圍。現在,這兩個環境級別的建議范圍是相同的。這次修訂擴大了建議的操作環境范圍。建議范圍的劃定為數據中心操作員維持高可靠性并以最高能效運行數據中心提供了指導。IT制造商會在允許的范圍內測試他們的設備,以驗證設備能否在這些環境范圍內正常工作。通常,制造商會在發布產品之前對其進行一系列的測試,以驗證其產品能否在該環境范圍內滿足所有的功能需求。
這不是一種可靠性聲明,而是事關IT設備的功能。但是,建議范圍確實是一種可靠性聲明。對于需要長時間工作的設備,IT制造商建議數據中心操作員將環境維持在建議的范圍內。短時間超出建議限值也許不成問題,但是在接近允許限值的情況下運行數月會導致可靠性問題增多。通過檢查大量IT制造商的可用數據,2008年的擴展建議范圍是所有IT制造商一致認可的可接受范圍。如果IT設備在此范圍內工作,其整體可靠性就不會受到任何影響。
需要注意的是,應確保IT設備機架頂端滿足適當的進氣條件。許多數據中心機架頂端的進氣口溫度偏暖。當溫熱的機架廢氣無法直接返回到空氣處理設備中時,情況更是如此。這些溫暖的空氣還會影響相對濕度,造成機架頂端的相對濕度值降低。
大多數中小型企業數據中心管理者卻認為,有點灰塵根本不會影響到服務器,沒什么大不了。但是專家們卻表示說,這些灰塵塵埃肯定會影響服務器和數據中心其他設備的功能。
數據中心安裝的全部都是靈敏設備,這與其他辦公環境不同。灰塵顆粒不僅會影響設備的使用,而且超靈敏煙霧探測器也會探測出污染物的位置,當微粒增多時會誤以為是煙霧而發出報警。當然,數據中心一定要避免出現這種情況。數據中心的清潔不僅要進行常規除塵、真空吸塵,而且還要對房子周圍進行清潔。