在新型冠狀病毒疫情的影響下,很多全球數據中心運營商已經進行了重大的運營調整,其中的一些變化可能會在疫情之后持續。
正在肆虐的新型冠狀病毒疫情給全球經濟的發展帶來了嚴重影響。企業需要重新考慮 “業務連續性計劃(BC)和災難恢復計劃(DR)”, “D”(災難恢復)可能出現最糟糕的表現, “C”(連續性)的數值已從常數變為一個變量。
從歷史上看,大多數數據中心的業務連續性計劃都是基于本地情況。通常災難只會對某個區域造成了嚴重破壞,很少有人想到這個區域是整個地球。
全球知名的數據中心標準組織Uptime Institute公司的首席技術官Chris Brown說,“我認為,很多人會想當然地認為,當災難來臨時將有足夠的時間做出響應。我認為新型冠狀病毒疫情告訴大家的是,病毒將會通過人類的活動非常迅速地傳播到世界各地,其速度遠遠超過人們對此做出的反應。”
關鍵任務IT工程服務商i3 Solutions集團董事長Ed Ansett表示:“我們過去50年一直在為防御核攻擊做好規劃,這是人們公認的主要威脅。并圍繞病毒傳播進行了大量建模,但是事實上我們對新型冠狀病毒并不了解,也難以應對。”
心態的改變
冠狀病毒疫情對于全球各地的數據中心至少目前還不算是強烈的風暴。因為全球的數據中心大部分都可以正常運行。雖然一些數據中心設施現在已經不堪重負,但是總體而言,大多數數據中心基礎設施還是展現出相當大的彈性。
行業專家指出,現代企業數據中心如今可以通過只有幾名現場工作人員的管理就可以正常運行。通常可以將現場人員削減到兩名,而且還要調整輪班時間。
數據中心運營商Digital Realty公司全球運營高級副總裁Danny Lane表示:“為了應對疫情,我們制定了合理的輪班時間表,以最大程度地減少現場工作人員,同時確保大多數設施在工程和安全方面實現全天候覆蓋。Digital Realty公司的所有團隊都采取了社交遠離的措施,面對面會議已被電話會議或視頻會議所取代。我們繼續允許授權人員進入數據中心,但我們要求所有人員只在必要的情況下進入數據中心。如有必要,我們會在人流量較高的位置監視數據大廳的人員流量,并在需要時使用人員管控方法來支持社交遠離。”
數據中心運營商NTT公司全球數據中心運營高級副總裁Bob Woolley表示,該公司的數據中心已經實施一人或兩人輪班制度,其輪班時間從8小時延長到12小時,其中包括輪班成本較高的加利福尼亞州。輪班制將進行現場監控,并確保數據中心運行連續性。
此外,數據中心維護和技術團隊將在工作日被安排定期輪班。有時數據中心主管可能會代替現場技術人員,從而使這些技術人員可以在家遠程工作。Woolley說,由于現在禁止非必要人員進入數據中心,因此很多數據中心裁減了一些維護人員。
他說,“實際上,我們現在并不需要那么多的維護人員。而對于某些數據中心園區來說,可以只對其核心設施進行輪班的監視。”他承認,應對如此大規模的事件,目前還沒有固定的模式可以遵循。
Woolley說:“目前的整體理念是,盡量減少與核心技術人員的接觸,而他們實際上知道如何解決數據中心可能出現的問題,這些都是我們要以特殊方式保護的人才。這種特殊的保護級別旨在使這些具有獨特能力的人才能夠保持數據中心正常運行。”
數據中心運營和技術人員被分配到一棟建筑物工作,并且不得在建筑物中隨處走動。他們可以從建筑物的設備裝卸入口進入,或從客戶未使用的入口進入。而在客戶大廳,接待人員需要穿戴防護服接待客戶。或在某些情況下,在數據中心外部的客廳接待客戶。
Woolley說:“我們的客戶是一些最重要的關鍵服務提供商,他們正在努力保持數據中心基礎設施的正常運行,以便企業可以召開電話會議。這些數據中心仍在努力擴大自己的足跡,因為正努力滿足用戶需求。”
全球最大的數據中心運營商Equinix公司美洲區總裁Jon Lin表示,該公司將繼續遵守所有政府法規和公共衛生指南。
他表示,Equinix公司也正在執行人員配置最小化的政策,盡管其當前的策略是減少每個員工在其指定綜合設施中花費的時間。為了最大程度地減少客戶對數據中心的訪問,Equinix公司正在加強其智能機械手服務。數據中心提供商及其客戶總體上比過去更多地依賴于智能機械手服務和遠程管理工具。
Jon Lin說:“在冠狀病毒確診病例數較高的地區,所有IBX(國際商務交易所)的訪客都必須由安全人員使用非接觸式紅外溫度計進行溫度檢查。那些體溫高于37.3攝氏度的人員不得進入。”
Uptime Institute公司首席技術官Chris Brown表示,對于某些數據中心來說,在異地的工作人員(包括數據中心設施經理)都被要求居家隔離,除非必須在現場處理事務。通常采取每天兩個輪班的制度,并要求配備第三個輪班小組,以防主要工作人員出現感染癥狀。
輪班之間的交接現在采用的是非接觸式的形式。他解釋說:“一個班次的工作人員在將控制室消毒清潔之后然后離開,另一班次人員再進來,他們可以通過手機進行溝通協調。”
此外,還要調整典型的輪班表(通常包括關鍵設施區域的演練,例如檢查數據層、機房和運營設施)。在正常情況下,這種演練的好處之一是使工作人員能夠在問題發生之前就會事先發現。而在目前可行的情況下,這種演練將被遠程監控所取代。
對遠程監控工具進行長期投資
Brown表示,一些數據中心運營商正在對遠程監控工具和服務進行長期的資本投資,這是冠狀病毒疫情對正常管理模式產生長久影響的第一個明確跡象。在最糟糕的情況下,盡管在這種情況下可能會推遲關鍵設施的維修和更換,但此類工具可能會使數據中心設施正常運轉而無需現場人員維護。
他說,“我所知道的所有數據中心都在使用遠程監視和遠程控制的各種功能,以更好地運行他們的數據中心,減少輪班、減少設施人員數量,或者不讓工作人員在數據中心隨處走動,這可以更好地保護他們。”
裁員會成為永久性的措施嗎?
從總體上講,自從冠狀病毒疫情開始以來,技術和措施的轉變在一定程度上是導致最終用戶獲得優質服務的原因。到目前為止,還沒有重大互聯網或云計算服務中斷的報道。也沒有關于大型面向公眾的企業(例如大型銀行)由于其技術基礎設施故障而導致業務中斷的報告。
但現在才持續一兩個月的時間。對于數據中心運營商來說,在更長時間內保持數據中心正常運行的挑戰是巨大的。
i3 Solutions集團董事長Ed Ansett警告說:“我們遇到的問題是認為可以通過自動化來控制一切,并認為自己擁有遙控和管理之類的工具。我認為這在很大程度上是對的,但也有例外情況。如果有一件事出錯,例如用戶無法從銀行提取資金,可能只是一個網絡補丁的問題,但在疫情持續的情況下,這種情況將會加劇,從而影響數據中心運營商的聲譽。”
但Ansett認為,自動化技術可以在疫情過后的數據中心維護中發揮積極作用。從維護過程中消除人為干預可以減少人為錯誤的機會。使其人工流程更加標準化,這可能會帶來進一步的好處,使維護流程更易于培訓,從而解決了先前存在的技能短缺問題。
他說:“數據中心每次人員進入時,它出現故障的可能性就會成倍增加。這就是容易造成數據中心故障的人為因素。”
但Uptime Institute公司首席技術官Chris Brown表示,以往的經驗表明,一旦危機結束,包括數據中心管理人員在內的員工往往會回到熟悉的工作模式。
他說:“很多人都說,這將改變我們今后的生活和工作方式。但縱觀歷史,每當人們面臨重大挑戰時都會感嘆:‘這是改變生活的時刻!’。但是生活和工作其實并沒有太大改變,可能只有一些微小的改變,但是通常人們一旦忘記了痛苦,他們就會回到原有的工作方式。
他表示,根據其25年的數據中心自動化經驗,從未見過的一件事就是減少數據中心工作人員的數量。可以了解的一件事可能是人們想要減少輪班人員之間的聯系,并更多地依賴自動化和監控技術。但是縱觀歷史,不知道其中某些突發事件能否成為新的規范,并且會導致某些行為發生永久性的改變。
版權聲明:本文為企業網D1Net編譯,轉載需注明出處為:企業網D1Net,如果不注明出處,企業網D1Net將保留追究其法律責任的權利。