精品国产一级在线观看,国产成人综合久久精品亚洲,免费一级欧美大片在线观看

采用電源循環測試查找硬件故障

責任編輯:editor007

2016-12-29 14:46:15

摘自:UPS應用網

摘要: 如今,企業采取各種措施不讓意外停機時間中斷其數據中心業務。而進行電源循環測試,以主動監控系統并以有條不紊,有序的方式識別硬件故障是一種很好的措施。隨著數據中心使用虛擬化和群集,其工作負載將繼續運行,同時識別和修復故障系統。

如今,企業采取各種措施不讓意外停機時間中斷其數據中心業務。而進行電源循環測試,以主動監控系統并以有條不紊,有序的方式識別硬件故障是一種很好的措施。

由于在數據中心日常操作期間可能不會使用IT系統的所有部分,因此IT組件可能會失效或軟件模塊可能崩潰,但系統可能會正常運行數月甚至數年。在系統重新啟動(通常意外)之前,故障可能無法顯示,從而導致意外的工作負載中斷和停機時間。而企業需要通過周期性電源循環測試,以識別可能出現的問題并主動解決問題。

如果沒有看到任何問題,為什么要執行電源循環測試?

數據中心所采用的系統管理工具包括Microsoft System Center,SolarWinds,Nagios和Zabbix這些強大的多功能平臺。幾乎所有的系統管理工具都可以提供故障,配置,會計,性能和安全管理等功能,使其成為現代企業不可或缺的一部分。

但是,某些故障可能發生在硬件級別,但可能不會立即影響系統或工作負載。例如,可能在服務器的雙列直插存儲器模塊(DIMM)中檢測到存儲器故障。但是,如果沒有工作負載使用該內存空間,或者故障DIMM采用了故障糾正技術保護,則服務器可以繼續工作,很少向系統管理報告其直接錯誤。在大多數情況下,現代服務器的智能平臺管理界面或基板管理系統可以報告這些錯誤,但是該信息通常只是記錄,系統及其工作負載將繼續運行。

而那些未檢測到的和未解決的硬件問題才是最大的問題。如果意外的系統崩潰或電源中斷導致計劃外的系統重新啟動,則系統的內部固件可能會看到這些問題并拒絕完成引導過程。例如,如果服務器的南橋芯片出現故障,并且USB或板載磁盤控制器功能未初始化或響應,則引導過程將停止,即使企業可能不使用服務器的USB端口,而是通過網絡訪問存儲。現在,IT部門必須嘗試從意外中斷中恢復,并同時解決有缺陷的系統。

為了避免出這種情況,請進行定期現,并主動進行電源循環測試,以強制在低級別硬件中重新啟動系統。除了在計劃外中斷或停機期間進行加擾,還可以使用計劃的重新啟動來確保數據保護,并以有組織的方式將虛擬機或存儲實例遷移到目標設備之外。接下來,循環上電,并允許硬件系統完全啟動,以顯示潛在的未知或未解決的問題。系統電源循環通常作為組織現有關閉文檔的一部分。如果在重新啟動過程中出現問題,企業將采取更好的準備采取糾正措施。

應該如何接近電源循環測試,以及應該多久進行一次?

具有高質量設計的服務器可以運行多年。當企業在彈性配置(例如服務器集群)中部署這些服務器設計時,這些系統上支持的工作負載幾乎是不可破壞的。事實上,強調系統彈性和正常運行時間常常導致許多組織放棄周期性的功率循環。

但是如果一個服務器或存儲子系統運行了幾年,你怎么知道它會正常啟動?如果不知道,那么希望系統能夠成功冷啟動的唯一方法是定期進行測試。

電源循環測試需要什么樣的依賴關系?

企業的數據中心根據需要進行電源循環測試,以便為其業務需求達到合理的置信水平。通常,可以每幾個月或每年進行幾次電源循環。將電源循環測試與常規災難恢復和關閉測試保持同步,以便同時處理這兩個目標可能是一個好主意。

有時,也有一些外部因素影響數據中心的正常運行,例如變電站升級改造或重要的建筑物改造,迫使企業使數據中心離線一段時間。如今,計劃停機可以減少業務中斷,因為企業的數據中心可以輕松地將工作負載遷移到輔助數據中心或云計算。所以任何IT團隊準備處理計劃內的設施關閉也應該能夠進行常規電源循環。

服務器硬件有任何風險嗎?

當數據中心啟動和運行服務器或存儲陣列時,總是有一定程度的電,熱和機械應力。當允許電子元件冷卻并再次升溫時,可能會導致熱應力,可能會導致邊緣連接失效,并導致過早的系統故障。類似地,如果讓老化的磁盤或冷卻風扇冷卻,它可能因潤滑劑耗盡而卡住,并導致磁盤/風扇主軸或產生其他微妙機制的問題。

另外,還存在潛在的邏輯風險。意外的配置更改可能會使IT系統超出范圍,并導致由于系統配置管理工具的警告或應用程序啟動問題。例如,如果系統重新啟動并嘗試安裝意外或未批準的修補程序,則配置管理工具可能會暫停工作負載或服務器集群啟動,直到系統的批準配置恢復為止。

這樣的問題是罕見的,特別是在現代的數據中心節能系統中。雖然一些IT專家認為電源循環可以減少這種故障的可能性,但是計劃的電源循環測試正是沉淀,隔離和解決這些類型問題的辦法。早期暴露任何問題最好等到意外的電源故障或應用程序崩潰,并發現系統未正常啟動的隱患。

隨著數據中心使用虛擬化和群集,其工作負載將繼續運行,同時識別和修復故障系統。

鏈接已復制,快去分享吧

企業網版權所有?2010-2024 京ICP備09108050號-6京公網安備 11010502049343號

  • <menuitem id="jw4sk"></menuitem>

    1. <form id="jw4sk"><tbody id="jw4sk"><dfn id="jw4sk"></dfn></tbody></form>
      主站蜘蛛池模板: 特克斯县| 桐城市| 吕梁市| 平利县| 和顺县| 灵丘县| 建始县| 杭州市| 井冈山市| 宁晋县| 南昌县| 金湖县| 柘荣县| 靖安县| 长子县| 宝鸡市| 北碚区| 韶山市| 庆云县| 乌拉特中旗| 通化县| 宣汉县| 涞源县| 孝昌县| 丰顺县| 南岸区| 皮山县| 柳林县| 全椒县| 普兰店市| 保定市| 澄江县| 镇雄县| 惠东县| 隆回县| 明水县| 华宁县| 巍山| 日照市| 金沙县| 博湖县|