過去我們對于電視信號不好的解決方案,都有一個共識:拍一拍。
現在我們對于電腦、手機死機的解決方案也有一個共識:重啟。
服務器故障怎么辦
但是,當我們面對服務器出現故障時,又該做出什么反應呢?如果你要是拍一拍,估計服務器不會給你任何反應,但是你的同事可能會用狐疑的眼神兒看你;如果你立刻重啟,你的上司可能會臭罵你一頓。那么服務器故障時,作為專業的技術人員該做出什么反應?
知己知彼
知己知彼
如果你是新人,想要知己知彼,就一定先要搞清楚服務器硬件情況。因為有時候服務器是裸機狀態,所以,如果你不了解服務器的硬件情況,了解一下這里的IT架構和具體的硬件信息是很有必要的。諸如網絡狀態、有沒有不間斷電源、硬盤是否支持熱插拔、服務器是不是HA高可用集群等問題。
摸清表層
即便只是看清表層,我們也需要盡可能多的了解有用信息,例如:服務器何時故障的?故障表現是什么?故障有沒有呈現規律性?上一次更新是什么時候,更新了什么等問題。畢竟服務器不是電腦,如果你沒搞清楚狀況就進行強行關機,很可能造成數據丟失,而且還沒解決問題。要記住,服務器是7*24小時開機的存在。
只有了解了服務器故障的基本邏輯,查看了日志等信息,盡可能的了解問題所在,才能給出具體的解決方案。
了解過去
我們常說以史為鑒或者讀史使人明志,其中都體現了了解過去的重要性。所以我們要先看一下過去都發什么可什么。查看歷史操作記錄,可以了解過去有誰登陸了,都執行了那些命令,更多的信息對于你的判斷準確性由很大的提升。但是,作為admin用戶,在查看歷史記錄時,要注意不要利用自己的權限去侵犯別人的隱私。
看清現狀
看清現狀
做過了以上的準備,你還需要檢查一下現在有沒有其他人在線。如果有人正在在服務器上工作,而你卻莽撞的對服務器進行其他更改,那你可能要面臨一個很糟糕的情況。除了看誰在線之外,你還可以了解一下誰登錄過。另外,還要看清現在有哪些程序正在運行,并作出相應的調整。
然后你就可以根據自己的判斷,對服務器進行修復了。
切記,在服務器上,拍一拍和萬能的重啟都是莽撞之舉,在服務器出現故障時,要了解服務器故障的具體原因,方能對癥下藥。