近日,中國工商銀行(601398,SH;1398,HK)信息科技部就6月23日工行系統故障事件(以下簡稱“6·23事件”)正式作出內部通報,這份通報稱,工行數據中心(上海)主機系統出現故障,是由于IBM提供的主機DB2V10版本內存清理機制存在缺陷引發。
而在技術問題之外,工行本身的管理問題以及國內銀行業信息系統落后的沉疴可能也是此次事件的誘因。
2013年6月23日,一位市民從中國工商銀行浙江省臨安支行門前經過。 來源:胡劍歡 / 東方IC
事件原因直指IBM:軟件存在缺陷
6月28日上午,工行某直屬一級分行信息科技部員工陸續收到內部通報郵件。該通報就6·23事件的情況及原因作了基本描述,但對事件影響范圍、內部處理能力判斷均語焉不詳。
通報稱,“6月23日上午,數據中心(上海)監控發現主機CPU利用率升高,經分析判斷與6月23日凌晨實施的主機DB2數據庫軟件升級版本有關(從V9升級到V10),在緊急回退升級系統軟件版本后系統運行恢復正常。”同時,工行總行信息科技部將該事件直接原因歸為IBM公司提供的軟件產品存在缺陷,并稱這點“經IBM公司正式確認”。
工行就6·23事件做出的正式內部通報文件
6月23日上午,全國多地中國工商銀行柜臺、ATM、網銀業務出現故障,持續近1個小時。作為服務2.92億個人客戶及400多萬公司客戶的全國金融服務巨頭,工行此次故障波及北京、上海、廣州、武漢、哈爾濱等多個大中型城市。
當日,工行將該事故對外模糊描述為:“中國工商銀行部分地區因計算機系統升級原因造成柜面和電子渠道業務辦理緩慢。”這也是迄今為止工行就6·23事件向用戶發布的唯一公開解釋。
IBM公開官方資料顯示,工行與IBM的合作始于1997年,至今16年之久。針對通報中提及的“經IBM公司正式確認”,記者聯系多位IBM相關負責人,但均未得到回應。
工行IT運維能力遭質疑
這份內部通報由一位不愿透露姓名的工行在職員工提供。該員工表示,自己并不太滿意這份解釋:“對災難備份只字未提,有意將管理問題規避為技術問題。”
通報也提及了一些管理問題,但表述頗為模糊,通報稱,“(數據中心上海)沒有按照‘第一時間恢復生產’的要求采取果斷措施及時進行回退,并且回退過程不堅決,耗時較長。”
銀行的災難備份系統,是指銀行對本地數據中心的數據、業務系統、軟硬件等資源進行同城或異地備份,以確保發生某些不可預測的災難后,重要信息系統的數據安全的一種預防措施。
據中國銀行業監督管理委員會(以下簡稱“銀監會”)發布的《銀行業金融機構信息系統風險管理指引》,銀行業金融機構應制定信息系統應急預案,并定期演練、評審和修訂;全國性數據中心要實現異地災備。
日前,國內 最大的災難備份服務商萬國數據CEO黃偉在接受福布斯中文網采訪時表示,“銀行的IT系統永遠面臨信息安全的挑戰,但悲哀的是,銀行在IT系統和災難備份中不計成本,但遇到這樣的大面積的安全問題依然無法在短時間內恢復系統。”他認為,長久以來國內銀行的IT系統運作是在給這樣的事件埋下伏筆,他最后指出,“在國內銀行,IT系統的搭建更像是給上級和銀監會看的‘政績工程’。”
2008年,現任銀監會副主席郭利根曾就多起國內銀行信息科技風險事件發表講話。他說,工行等國有銀行是國內在IT技術和風險管控上都比較先進的銀行,它們的問題頻發,“充分暴露出我國銀行業信息系統的脆弱性。”
他指出,基礎建設滯后、軟硬件及核心技術受制于人和系統管理粗放是當時銀行業信息科技建設存在的主要問題,“特別是在業務連續性規劃、業務恢復機制、風險化解和轉移措施、技術恢復方案等方面,存在明顯的‘短板’。”
整整五年過去,工行6 23事件證明了這些問題仍舊沒有得到有效解決。