又宕機了!?
粗略總結下最近的宕機事件:淘寶-挖掘機,光線被挖斷;攜程-程序員誤刪;知乎-又是機房故障;以上幾家互聯網公司的宕機事件直接影響了用戶體驗,誰都不想當下一個例子。同樣的,銀行系統宕機事件更是非同小可。
在調研銀行系統安全性問題中,發現了一個典型案例:西部某地方銀行去年發生過一起長達37小時的系統宕機事故。導致存取款、網銀、ATM等銀行核心業務全部中斷;間接影響全市醫療機構和定點零售藥店共700多家不能刷醫保卡結算;影響還波及政府、教育等多個領域。事故后果很嚴重。
讓我們來分析下該銀行的宕機原因。
傳統備份系統惹的禍
有據可查的是,銀監會發文中特意向全國通報了該事故,原來該事故起因竟是由于備份系統。
發文中對事故原因的具體解釋為:在季末結算業務高峰時,因備份系統異常導致備份存儲磁盤讀寫處理嚴重延時,備份與主存儲數據不一致。在采取中斷數據備份錄像后,造成生產數據庫損壞并宕機。
文中的解釋比較言簡意賅,但根據有經驗的技術專家分析,從該解釋中可以推測幾點:
首先,業務高峰并沒有導致主存儲磁盤讀寫問題,在線業務無問題。
其次,業務量大“導致備份存儲磁盤讀寫處理延時”,這說明相比主存儲,備份存儲可能由于檔次過低,或者磁盤配置不合理等原因導致性能較差。
關于這點,專家分析,一般建設備份系統的投入要遠小于在線業務系統的建設。而體現在數據中心內,就是購買的備份磁盤陣列往往比核心存儲檔次要低。在磁盤的選擇上備份系統也大多采用可靠性次于高速SAS磁盤的大容量SATA磁盤。存儲檔次低,磁盤配置差導致備份存儲性能嚴重不足。
也就是說,該銀行的備份系統建設模式,應該跟大多數數據中心備份系統有同樣的問題,即:磁盤配置差,備份存儲性能低。
也可以看出,大多數企業存在著這樣的宕機隱患。那么信息安全如此重要的今天,如何解決這個問題?
對稱雙活技術你考慮不
既然問題發生在存儲系統上,那么解決問題的辦法也蘊藏在存儲系統之中。
小知識點:企業級存儲方案,一般分為備份、容災、雙活/多活、兩地三中心等。根據企業的業務規模和核心數據的重要程度,一般金融、稅務、電信等行業的大規模關鍵業務數據保護,多采用雙活和兩地三中心方案,在業務連續性方面提供最高等級的保障。
調研了解到,基于磁盤陣列的對稱雙活技術,是一種針對備份系統不足的最佳升級方式。
但是,原有的對稱雙活存儲技術主要實現在存儲的兩個控制器之間。小編采訪中了解到,宏杉科技在對稱雙活存儲技術上實現了突破:將一臺存儲兩個控制器之間的冗余,變為了兩臺存儲之間的冗余,而且不需要在服務器端增加任何第三方軟硬件,可以直接在兩臺存儲之間進行數據同步。當其中一臺存儲發生故障,另外一臺存儲會立即接管業務。實現RPO、RTO均為0的高等級數據保護。
時間短 速度快 擁有五大優勢
具體而言,雙活讓備份系統有了五大優勢。
1、無需備份窗口,備份時間短。對稱雙活存儲系統中的兩臺存儲陣列同時處于工作模式,組成雙活鏡像對的數據卷可同時被服務器進行讀寫訪問。得益于系統內部高效的數據同步技術,在兩臺存儲同時進行數據寫入時,數據一致性也能得到有效保證。數據同步高速、可靠,沒有備份窗口問題。
2、恢復時間短,確保恢復。對稱雙活存儲系統中的兩臺存儲陣列相互冗余,當其中一臺存儲陣列發生故障,另一臺存儲陣列直接接管。面向服務器的切換透明,迅速。對前端業務無影響,且無需人工干預。秒級切換,恢復系統故障。
3、簡化帶寬要求,備份速度快。對稱雙活存儲系統中的兩臺存儲陣列采用萬兆以太網進行數據同步,通過光纖直接連接。不僅保證了數據同步速率,而且簡化了對于網絡鏈路的要求。備份數據流占用業務網絡帶寬的問題一去不返。
4、不需要安裝第三方備份軟件。對稱雙活存儲系統采用虛擬卷技術,組成雙活鏡像對的數據卷雖然物理位置在兩臺存儲陣列上,但被虛擬成了一個邏輯卷。對服務器而言,雙活鏡像卷就像是一個普通的數據卷,只不過可以通過多條路徑訪問。服務器端不需要安裝任何第三方軟件,只需要通過服務器操作系統中自帶的多路徑軟件,就可以實現對數據卷的正常讀寫和故障切換控制。
5、實現遠程容災和雙活數據中心——對稱雙活存儲系統通過引入仲裁者機制,可以突破一個數據中心的限制,將雙活存儲中的一臺部署到最遠100KM以外的另外一個數據中心,且不影響雙活存儲的任何特性,真正實現RPO為0、RTO為0的SHARE78最高等級數據容災。面對災難,從此您無懼無畏。
概括來說,就是技術簡單、高效、安全、易擴展。目前這種對稱雙活技術從眾多數據保護技術,已經成為升級備份系統的最佳選擇了,宕機問題不怕不怕了。