有人說在云計算工程領域,最難的部分是運維,因為管100臺、1萬臺或是100萬臺機器,是完全不同的概念,你想機器少可以人管,機器多了還能靠人么,當然不能了。再則,運維系統不屬于功能性的東西,常常因為用戶看不見而被嚴重的低估。在8月份的“云計算運維的那些坑兒”那期在線培訓中,VisualOps CTO王旭也談過云計算運維的相關問題。但這里說的機房運維只是云計算運維的一個部分,事實上,隨著云平臺被越來越多的企業被認可和使用,越來越多的用戶開始在云平臺上部署自己的應用,如何在云平臺上進行自動化運維也就被越來越多的企業所關注的難題。
云計算時代的運維和傳統的運維到底有哪些不同?亞馬遜AWS中國云解決方案架構師王毅表示傳統層面的運維人員,接觸的都是硬件,如服務器、設備和風火水電,但是在云時代,運維人員已經無法見到物理的任何設備。所以從這個角度看來,云計算時代的運維的手段和運維的目的都和傳統的運維都是不一樣的,因為運維人員不需要維護物理硬件的穩定和可靠性。
當然,上帝在開了一扇門的同時想必也是會合上一扇窗戶。既然運維人員不再需要被束縛于物理硬件的穩定和可靠性,那新的問題就來了。云計算時代,也給用戶帶來了新的挑戰。
在亞馬遜AWS中國云解決方案架構師王毅看來,云計算帶來的不同于傳統運維的應用層面的三個挑戰:
應用如何在云平臺上實現應用的快速部署,快速更新,實時監控。云計算時代要求運維人員能夠自動化地部署應用程序和所有支持的軟件和軟件包,然后通過生命周期階段操作維護和管理應用程序,如自動擴展事件和進行軟件更新等一系列的操作。
如何快速創建和復制資源模板。有序地對資源模版進行資源配置和更新;
如何在云端更加輕松的部署、配置和管理應用。如何利用工具輕松地在云中快速部署和管理應用程序,同時可以自動處理容量預配置、負載均衡、Auto Scaling和應用程序狀況監控,這是對運維人員的新要求。
面對這些挑戰和變化,大部分運維人員開始了轉型之路以應對時代的變化。談到運維人員轉型的建議,王毅認為傳統的運維更多的是與物理設備打交道,很少接觸操作系統甚至是應用程序的層面。所以他建議運維人員在云平臺階段應該更多介入軟件部分,而且需要有代碼基礎。因為在云時代,infrastructure as code,所有對物理設備的操作都變成了代碼。