關注智能自動化運維的趨勢與難點
智能自動化運維是云數據中心時代尤為重要的趨勢。公有云讓基礎設施資源更集中,企業放棄自建數據中心轉而使用公有云,基礎設施資源因此集中到了第三方服務商的手中。
這一定程度上使得企業運維輕量化,更注重上層應用的運維,后端較重的基礎設施運維轉嫁集中到了第三方公有云服務商的身上。基礎設施運維的集中化,大體量化為自動化運維提供了良好的生存空間,企業前端的輕量的運維甚至也可以通過大數據以智能可視化的方式呈現出來。
多平臺融合的導致故障點監測困難
有業界人士稱,相對于傳統IT架構,云數據中心運維的管理對象主要分為五大類,分別是:
機房環境基礎設施部分,包含風火水電等;各種設備,包括存儲、服務器、網絡設備、安全設備等硬件資源;系統與數據,包括操作系統、數據庫、中間件、應用程序等軟件資源及業務數據;管理工具,包括了基礎設施監控軟件、監控軟件、工作流管理平臺、報表平臺、短信平臺等
從中可以看出,一項云數據中心向外界提供服務是多方服務融合的結果。因此,當面臨一個故障時,如何在諸多服務中準確追溯到故障點,是運維人員需要關注的另一個問題。
避免人為失誤與網絡威脅
前不久,中國某大型云廠商因運維人員操作失誤啟動了一個BUG,導致一些客戶訪問官網控制臺和使用MQ、NAS等多項產品功能出現問題,造成了較大影響.實際上,除了自然災害等原因,數據中心運維出現的一些安全問題極有可能是人為導致的。
出了要避免人為上的失誤,來自網絡的威脅也不可小覷。數據中心資源的集中化讓我們逐漸感受到,數據中心故障的大型化趨勢越來越明顯,從網絡安全的角度來說一個漏洞被利用,就可能會造成較大的數據丟失甚至設備停機事故。