進入21世紀以來,制造、中小企業、能源、交通等領域對服務器,特別是中低端IA服務器的需求激增,過去僅僅可以應用在RISC平臺、HP-UX環境下的容錯產品也面臨著新的挑戰。另一方面,企業越來越依賴信息系統來完成關鍵業務的應用,同時他們不可能配備更多的專業人員來進行專職維護。雙機熱備、集群服務器遇到難題。
NEC通過與美國容錯公司多年的合作,于2001年推出了業界第一臺基于IA架構、支持Microsoft Win-dows Server2000標準操作系統環境的容錯服務器。NEC的Express5800/ft系列在Windows及Linux平臺上的可靠性達到了99.999%,這種實時保護技術來源于STRATUS連續處理技術(Fundamentalsof Continuous Pro-cessing Design),它包括:
1、LOCKSTEP技術
LOCKSTEP技術使用相同的、冗余的硬件組件在同一時間內處理相同的指令。LOCKSTEP技術可以保持多個CPU、內存精確的同步,在正確的相同時鐘周期內執行相同的指令。該技術保證能夠發現任何錯誤,即使短暫的錯誤,系統也能在不間斷處理和不損失數據的情況下恢復正常運行。
2、安全故障(FAILSAFE)軟件
FAILSAFE軟件和LOCKSTEP技術運行一樣,可防止很多軟件錯誤和儲運耗損。該軟件在Windows2000/2003環境下采用熱插拔、內存鏡像、負載均衡、多點終止失效、多通道I/O等方式,大大增強了系統連續運行的穩定性。FAILSAFE可以管理和診斷特征捕獲,分析和通報服務器的軟件問題,從而允許個人在軟件發生錯誤之前去糾正錯誤。
FAILSAFE軟件的下列功能增強了NECExpress5800/ft系統在Windows環境中的可靠性:保護短暫的硬件故障;通過增強的驅動程序預防軟件失效;軟件問題的捕獲、分析及修正;內存數據的連續性維持;豐富的糾錯功能可以解決各種不同的錯誤。為了避免物理撞擊等意外故障,安全故障軟件還提供了自動重啟功能,能夠將宕機前CPU與內存數據即時保存下來,最大限度地避免數據的意外丟失。
3、激活服務(ACTIVESERVICE)
當然,假如容錯服務器的硬件發生永久性故障,盡管系統能夠正常運行,也必須及時更換硬件才能維持容錯的冗余架構。容錯服務器都配備了簡易直觀的圖形界面來管理監測工具,(如NEC Express5800/ft提供了ESMPRO管理軟件),能夠對服務器中硬件運行及故障狀態進行適時監控。
容錯技術的應用已經開始從過去的證券、電信等領域進入基礎行業,如制造、能源、物流、交通及有著7×24不間斷運營需求的中小商業團體和政府。NEC為迎合互聯網的高速增長,為容錯服務器引入了最新的穩定、安全、可升級、功能強大的Linux版本。容錯的未來將會向更高的可用性、更卓越的可維護性發展。調查顯示,越來越多的用戶開始注重TCO(總擁有成本)而不是初期購買價格,更多的企業決定逐步放棄采用雙機熱備的方式來維護復雜的集群服務器,轉而將目光瞄向具有容錯技術的平臺或容錯服務器平臺。