澳大利亞當時時間12月13日早上,澳大利亞稅務局(ATO)的門戶網(wǎng)站、數(shù)字服務和網(wǎng)站“停止”提供服務。隨后官方證實,造成此次事故的原因是HPE提供的硬件存儲解決方案出現(xiàn)故障。
據(jù)悉,ATO于去年年底購買了兩套新的HPE 3PAR SAN設備。有外媒表示,數(shù)據(jù)丟失問題發(fā)生在從主SAN復制到從SAN上的過程中。而此次SAN故障已經(jīng)造成1PB的數(shù)據(jù)丟失。
更糟糕的是,本應該立即啟動的備份系統(tǒng)也出現(xiàn)了相同的問題。
經(jīng)過整整兩天的停機時間,ATO的主要網(wǎng)站重新上線。
當?shù)貢r間12月14日上午十點,ATO表示其稅務管理系統(tǒng)已經(jīng)進行備份并投入運行。而接下來的幾天,其他服務也將陸續(xù)修復。
當?shù)貢r間12月15日上午九點,ATO稱稅務代理門戶和業(yè)務門戶已經(jīng)全部恢復。同時提醒用戶注意使用高峰。
截止目前,ATO仍在努力恢復系統(tǒng)和應用程序受中斷影響的相關(guān)數(shù)據(jù)。
在此次中斷造成的數(shù)據(jù)丟失事件中,我們發(fā)現(xiàn)兩個需要注意的地方,一是,雖然ATO及時澄清納稅人的敏感數(shù)據(jù)并未受損,而這種因硬件問題導致數(shù)據(jù)丟失、服務暫停的事件也時有發(fā)生,但是此次丟失的數(shù)據(jù)量規(guī)模讓人印象深刻;二是,故障根本源于知名廠商HPE提供的存儲設備,這自然會引發(fā)大眾的關(guān)注。
熱心的國外的網(wǎng)友們就此次事件展開了十分活躍的討論。網(wǎng)友Jason就很好奇1PB的數(shù)據(jù)到底有多大,“如果用磁帶存儲,長度能到達月球?”網(wǎng)友Lupicia給出了看上去比較專業(yè)的回答:如果是LTO-7磁帶,存儲1PB數(shù)據(jù)需要約160公里的長度。
事實上,移動廣告公司Adfonic的CTO Wes Biggs曾向TechTarget記者生動描述了PB級數(shù)據(jù)的規(guī)模:如果用智能手機拍攝出來的照片平均大小為3MB,打印出來的照片平均大小為8.5英寸,那么總共1PB的照片的并排排列長度能達到48000英里——大約可以環(huán)繞地球2周。
也有網(wǎng)友表達對HPE 3PAR設備的不滿,Tazer79表示自己的HPE 3PAR 7400c設備在一年半之前也曾發(fā)生故障。網(wǎng)友juz88則對ATO表示質(zhì)疑,大多數(shù)政府組織使用NetApp/EMC,ATO卻偏偏選擇了HPE 3PAR,如今造成這么大的事故完全可以為典型案例向他的新客戶介紹了。
也有人稱ATO其實早已對HPE失去信心,并計劃將數(shù)據(jù)逐漸轉(zhuǎn)移到AWS。在今年9月份,ATO授予IBM一份400萬美元的合同,基于Accenture平臺開發(fā)一個連接ATO與企業(yè)的電子商務網(wǎng)關(guān)。而該平臺就是由ATO開發(fā),旨在將部門應用遷移到AWS上。
據(jù)最新數(shù)據(jù),HPE 3PAR的收入同比增長了100%。但是在全閃存陣列領(lǐng)域,HPE 3PAR排在Dell-EMC、NetApp之后。網(wǎng)友Chris Phillips表示他不會像ATO一樣將3PAR作為在關(guān)鍵環(huán)境中的SAN首選,因為“對他們的經(jīng)驗不太放心,況且價錢也不算便宜。”
但他表示,不能一味地批判HPE方面,“從我們迄今為止所知道的細節(jié)來看,這場事故永遠不應該發(fā)生在一個經(jīng)過精心設計和實施的企業(yè)SAN環(huán)境中。”