由于冠狀病毒疫情持續蔓延。一些數據中心運營商表示這導致其服務中斷,政府官員表示正在密切關注數據中心行業的發展。
發生的疫情迫使數據中心運營商投入更多的資金,以使其IT系統更加強大。疫情帶來的困難變得如此巨大,以至于有些業務和服務失敗。
英國一位政府官員在日前召開的一次行業會議上表示,不可靠的數據中心基礎設施對經濟和社會帶來的風險變得如此之大,以至于英國政府正在考慮通過法律使其變得更具彈性。在疫情發生之后,英國政府首次將物理數據基礎設施視為一個獨特的行業,在此之前,它被認為是對其他關鍵行業的支持服務。
然而,數據中心運營商將數據服務彈性不足歸咎于軟件供應商,并表示這對數據中心行業帶來不良影響,盡管他們自己的物理基礎設施正變得更加可靠。
數據中心運營商的一名高管在會議上建議,數據中心行業已經在采取進一步措施,以提高其抵御數據中心故障和災難的能力,這可能會提高運營成本,但肯定需要更多的投資。
根據數據中心標準機構Uptime Institute公司的統計,作為一直以彈性著稱并對其成就感到自豪的行業,數據中心行業致力于擁有更多的安全保障和故障切換系統,以確保無論發生什么災難,保證數據服務在平均99.982%的時間內保持正常運行。Uptime Institute是一家數據中心故障預防措施制定和認證標準的公司。
該公司執行董事Andy Lawrenc表示,Uptime Institute制定的可靠性衡量標準是根據其“Tier III”標準設計的數據中心,這是大多數數據中心運營商渴望的,即使他們實際上沒有達到這一標準。有人呼吁數據服務變得與電力一樣可靠。
3%的數據中心運營商報告數據中心宕機中斷
根據Uptime Institute發布的一項調查表明,3%的數據中心運營商承認,由于疫情使他們的工作無法抵御真正的災難,但其業務和服務完全中斷,他們尚不知道其后果有多嚴重,或者對行業的整體可靠性有何影響。數據中心工程師兼顧問Amber Williamson表示,但這些故障代表了在防范疫情的行業表現。
Williamson在會議上介紹了Uptime Institute的調查結果。她表示,這些數據中心運營商報告的數據中心中斷可能是異常情況。她說:“Tier III數據中心應該能夠進行任何維護,而不會影響IT和服務。它們根本不會出現任何中斷。”
她表示,中斷可能是由于工作人員的嚴重短缺造成的,因為這些員工由于疫情不得不在家工作。她表示,數據中心需要處理故障時可能沒有備件。
數據中心基礎設施彈性方面的新投資
根據Uptime Institute發布的調查報告,三分之二的數據中心運營商計劃提高其數據中心設施的彈性以應對疫情。這意味著構建更多的冗余系統,以便在緊急情況下接管。
Williamson說:“我們將看到彈性增強,這意味著我們將增加資本支出。”一家云計算廠商已經要求其數據中心提供商今后必須為每個基礎數據中心組件(如冷卻和電源)配備兩個冗余系統。
這份研究報告的作者之一、Uptime Institute的Lawrence表示,人員短缺意味著需要更大的彈性。他說:“如果數據中心繼續進行運營,那么在現場工作的員工人數就會減少,那么顯然必須為即使組件發生故障也要繼續運營進行規劃。其容錯度應該達到Tier IV。”
根據Uptime Institute去年對1100家數據中心運營商進行的調查,數據中心行業在疫情發生之前已經遭受了關鍵技能短缺的情況。數據中心行業的報告指出,人們越來越相信數據服務需要100%的可靠性,以使其像電力一樣具有保障,因為無人駕駛汽車之類的創新正變得至關重要。Lawrence表示,業界用戶已經對Tier IV數據中心的可靠性表現出了更大的興趣,Uptime Institute認為它能夠提供99.995%的正常運行時間。Lawrence指出,大多數數據中心運營商并沒有尋求對其可靠性的正式認證。
英國政府要求的數據中心可靠性
英國的文化、媒體和體育部(DCMS)在疫情期間負責保持政府部門數據基礎設施的運行,一位政府官員在網絡研討會上表示,該部門一直試圖確定其數據中心是否確實具有足夠的彈性,以確保在運行醫院和經濟重要數據服務時不會中斷。
英國的文化、媒體和體育部(DCMS)開放政府和開放數據負責人Sam Roberts在會議上說:“我們非常熱衷于了解數據中心行業的性質以及如何確保政策制定的未來適應性。這可能是諸如技能、獲得材料以及內置結構彈性之類的東西。冠狀病毒疫情使人們關注物理數據基礎設施的重要性。我們將其視為實現更廣泛的經濟和社會成果的重要基礎設施,這一點非常重要。我們認為,評估數據中心行業的彈性是明智的。這是英國政府首次全面審視數據中心行業,也是英國政府看待數據中心行業的方式的重大轉變。”
Roberts是英國的文化、媒體和體育部(DCMS)數據基礎設施彈性團隊的代表,該團隊于今年3月成立,旨在確保重要數據服務在疫情期間繼續運行。
他說:“我們正在評估政府部門是否可以發揮更大的作用。但是我們意識到,彈性和安全性已經成為數據基礎設施領域的競爭驅動力。”他帶領的彈性團隊將致力于解決數據中心行業的彈性和安全性問題。
他說,英國政府正在考慮是否將物理數據基礎設施指定為關鍵國家基礎設施(CNI)的正式組成部分。到目前為止,數據中心在向其他關鍵國家基礎設施(CNI)部門(例如衛生部門)提供數據時,一直被認為是關鍵國家基礎設施(CNI)。現在,由于英國政府將數據中心基礎設施視為一個獨特的部門,這個問題變得非常重要。數據中心運營商表示為此帶來更嚴格的監管。
增強數據中心基礎設施的彈性
數據中心運營商Virtus公司首席執行官Neil Cresswell在會議上說,數據中心基礎設施的彈性正在增強。
他說:“也許在軟件層面的彈性還不足夠。疫情危機迫使Virtus公司的數據中心只有70%至80%的員工在管理和運營。而企業管理層的選擇生死攸關,沒有人強迫員工去數據中心現場工作,而他們由于病毒傳染而生病或死亡是不值得的。”
Virtus公司一直在盡其所能提高彈性,并加速使用遠程管理系統,因此員工不需要在現場維護,而是采用自動化來執行操作和維修。
Cresswell表示,但是嚴格的出行限制以及供應鏈瓶頸使Virtus公司一些數據中心的建設推遲了三個月。而在疫情期間,對數據服務的需求幾乎翻了一番。
全球最大的數據中心運營商之一世邦魏理仕公司數據中心解決方案執行總監Andrew Jay在會上表示,數據中心基礎設施的彈性實際上一直在下降,,但這是由于軟件方面的問題。
他說:“如果人們認為他們需要超越Tier III標準,那將涉及成本和效率。我很想了解更多有關這種增強彈性的信息。”
Uptime Institute在其2019年年度調查報告中表示,數據中心中斷事件的三分之二是由軟件和網絡問題引起的,這表明它們可能超出了數據中心運營商的控制范圍。另外三分之一是由數據中心本身的電源故障引起的。
調查報告指出,“中斷仍然是代價高昂和普遍的。去年有三分之一的數據中心出現過停機。五分之一的數據中心的停機損失嚴重,造成了經濟損失、聲譽受損、違反監管規定以及安全問題。此外,十分之一的停機事件造成了100萬美元的損失。
而在這個調查中,將近250家數據中心運營商計劃更多地開展遠程管理,他們具有在疫情期間的運營經驗。 而四分之三的受訪者表示計劃使用自動化技術。
版權聲明:本文為企業網D1Net編譯,轉載需注明出處為:企業網D1Net,如果不注明出處,企業網D1Net將保留追究其法律責任的權利。