通常來講,就是對于重要的服務,使用兩臺服務器,互相備份,共同執行同一服務。當一臺服務器出現故障時,可以由另一臺服務器承擔服務任務,從而在不需要人工干預的情況下,自動保證系統能持續提供服務。雙機熱備由備用的服務器解決了在主服務器故障時服務不中斷的問題。從狹義上講,雙機熱備特指基于active/standby方式的服務器熱備。服務器數據包括數據庫數據同時往兩臺或多臺服務器寫,或者使用一個共享的存儲設備。在同一時間內只有一臺服務器運行。當其中運行著的一臺服務器出現故障無法啟動時,另一臺備份服務器會通過軟件診測(一般是通過心跳診斷)將 standby機器激活,保證應用在短時間內完全恢復正常使用。
企業為什么要做雙機熱備份?
決定是否使用雙機熱備,正確的方法是要分析一下系統的重要性以及對服務中斷的容忍程度,以此決定是否使用雙機熱備。即用戶能容忍多長時間恢復服務,如果服務不能恢復會造成多大的影響。一般意義上的雙機熱備都會有一個切換過程,這個切換過程可能是一分鐘左右。在切換過程中,服務是有可能短時間中斷的。但是,當切換完成后,服務將正常恢復。因此,雙機熱備不是無縫、不中斷的,但它能夠保證在出現系統故障時,能夠很快恢復正常的服務,業務不致受到影響。而如果沒有雙機熱備,則一旦出現服務器故障,可能會出現幾個小時的服務中斷,對業務的影響就可能會很嚴重。另有一點需要強調,即服務器的故障與交換機、存儲設備的故障不同,其概念要高得多。原因在于服務器是比交換機、存儲設備復雜得多的設備,同時也是既包括硬件、也包括操作系統、應用軟件系統的復雜系統。不僅設備故障可能引起服務中斷,而且軟件方面的問題也可能導致服務器不能正常工作。
雙機熱備份與數據備份之間的關系
一些用戶在規劃雙機熱備或雙機備份時,會有這樣的問題:我已經有了RAID,以及磁帶備份,還有需要做雙機嗎?或者,如果我做了雙機備份,還有必要做磁帶備份嗎?應該說RAID和數據備份都是很重要的。但是,RAID技術只能解決硬盤的問題,備份只能解決系統出現問題后的恢復。而一旦服務器本身出現問題,不論是設備的硬件問題還是軟件系統的問題,都會造成服務的中斷。因此,RAID及數據備份技術不能解決避免服務中斷的問題。對于需要持續可靠地提供應用服務的系統,雙機還是非常重要的。只要想一想,如果你的服務器壞了,你要用多少時間將其恢復到能正常工作,你的用戶能容忍多長的恢復時間就能理解雙機的重要性了。當然,RAID以及磁帶備份也是非常需要的。對于RAID而言,可以以很低的成本大大提高系統的可靠性,而且其復雜程度遠遠低于雙機。因為畢竟硬盤是系統中機械操作最頻繁、易損率最高的部件,如果采用RAID,就可以使出現故障的系統很容易修復,也減少服務器停機進行切換的次數。數據備份更是必不可少的措施。因為不論RAID還是雙機,都是一種實時的備份。任何軟件錯誤、病毒影響、誤操作等等,都會同步地在多份數據中發生影響。因此,一定要進行數據的備份。(不論采取什么介質,都建議用戶至少要有一份脫機的備份),以便能在數據損壞、丟失時進行恢復)。