拼功能?拼價格?你已經Out啦!不落到企業用戶場景里去談功能的產品,都是耍流氓!今天我們就從戴爾智能管理員OpenManage開始,落到用戶三大場景中去解密其用途和價值,且很多功能參數絕對您以前沒有聽說過!解密,即刻開始!
記得10年前,我和當時的同事在做服務器選型測試工作時,就不止一次談到這樣問題——當我們使用來自多家(主板/準系統)供應商的產品時,就會面臨管理方案不同的問題。
舉個例子,比如SuperMicro、Intel(EPSD)和Tyan這3家服務器ODM,在主板的管理上就有著不同的設計,包括BMC硬件以及與之配合的軟件。那么做為一家OEM廠商,如果只是簡單地組裝銷售,用戶將無法獲得統一的管理體驗,很難從產品技術上形成品牌黏性。
至于較大一些的服務器品牌,為了解決這個問題會投入相應的研發,但只要您使用對比過,就會發現不同廠商在管理功能方面的差距不小。也就是說,除了硬件的品質之外,這也是一個能夠體現出Dell堅持國際領先技術和讓用戶“最簡單”宗旨的品牌優勢的地方。
那么服務器管理都能做些什么呢?相信不少讀者朋友對此都已經熟悉了。本文我們想以戴爾iDRAC生命周期控制器為例,帶大家簡單回顧BMC/IPMI的基本功能,并介紹一下怎么實現分鐘級部署千臺服務器,以及“無狀態服務器池“對云計算IaaS的意義。
iDRAC:什么是生命周期控制器?
戴爾iDRAC with Lifecycle Controller被稱為智能嵌入式生命周期管理,它的功能可以分為4個方面:
部署:(服務器)發現/編目,設置和操作系統部署;
維護:重新分配,修復,更換配件;
監控:電源,性能,告警/健康狀況;
更新:BIOS,Firmware和驅動程序。
根據我們的理解,基礎的部署、維護和監控功能由硬件來實現;而高級部署功能和更新則通過管理軟件來協助提供。服務器按管理方式又可分為帶外(out-of-band)和帶內(in-band)兩種,帶內管理可以通過安裝在OS中的代理執行;而帶外管理則基于下面要介紹的BMC硬件。
溫故知新:BMC/IPMI硬件與管理網口
上面的照片是在數年前拍攝于戴爾PowerEdge R910服務器主板,可以看到一顆NUVOTON(前身為Winbond)BMC底板管理控制器和旁邊的DRAM顯存芯片。現在主流的服務器BMC一般集成基本的顯卡功能。
上圖中用紅圈標出的部分,是R910服務器的管理網口,它是以一個子卡的形式安裝在戴爾專用的NDC網卡上,四路服務器在設計上與雙路有一些不同。BMC/IPMI硬件管理的網口可以共用板載以太網卡,也可采用獨立設計。
現在比較流行的是主板提供單獨的管理網口,受控于BMC芯片所在的嵌入式系統。這部分電路與主板上其它單元相獨立,只要+5Vsb/+3.3Vsb電源供應正常、管理網絡/串口連通,哪怕CPU、內存等損壞都可以進行iDRAC帶外管理操作。
硬件級遠程控制、系統安裝不用愁
這兩個截圖也是來自當年Dell R910上的iDRAC6
如上圖,除了遠程開關機、重新啟動等之外,iDRAC的一大基本功能就是遠程控制,或者說KVM(鍵盤、鼠標、顯示輸出)重定向。由于在操作系統完成安裝之前,通常無法使用遠程桌面這樣的工具,因此KVM更多是用在系統配置、OS安裝的階段。
就像當年我的一位朋友指著PowerEdge R710的管理網口說:“插根網線,不用接顯示器就能裝系統了。”這時可能還需要本地光驅,如果支持vMedia(虛擬介質)則會更方便。
有些用戶在網絡環境中有PXE引導服務器,并通過FTP/NFS將操作系統安裝介質映射給待安裝的服務器。不過在簡單環境中,使用USB重定向技術的虛擬介質用起來更加方便。如上圖,除了物理光驅/軟驅之外,我們還可以將客戶端的ISO鏡像映射為服務器上的“光盤”。
注:虛擬介質功能需要iDRAC Enterprise版本的License,相對基礎的iDRAC Express不提供支持。
以上功能主要涉及操作系統部署,以及在此之前的單機設置。當年我還測過有的IPMI遠程管理卡,提供類似的功能動輒要上千元,而現在服務器嵌入的高級管理特性已經不只于此。下面我們重點介紹一個——批量配置服務器來進一步提高部署效率。
自動化模板:分鐘級部署數千臺服務器
讓我們來看看iDRAC8的自動化服務器配置是怎么工作的。如上圖中的5個步驟:配置、采集、克隆、重新分配和維護基準。在服務器配置文件中,包括BIOS、PERC(PowerEdge RAID卡)、網卡/HBA和iDRAC/生命周期控制器的設置。
此外它還有多種使用模式,可以整合到已有的進程中,使用U盤對現場對服務器“應用配置”,或者在網絡設置中應用。使用OpenManage Essentials軟件來采集、設置和檢測配置的一到多漂移。
帶有生命周期控制器的iDRAC嵌入式服務器自動化特性,宣稱分鐘級部署數千臺服務器(應該是理想情況下)。對于一臺尚未配置管理IP和權限的戴爾13G服務器而言,只需要標準的網絡資源——DHCP服務器和標準網絡共享,然后上架、連線即可。
我們再看一下自動設置的工作流:
1. iDRAC發送DHCP請求到DHCP服務器;
2. DHCP服務器響應(給出)IP地址以及選擇字段;
3. iDRAC檢查選擇字段并恢復來自遠程共享的服務器配置文件;
4. iDRAC應用配置文件到服務器,根據變化的需要服務器可能會重啟。
上圖中的步驟更加形象些,希望有助于大家理解。部署并配置好一臺“golden server”(相當于模板)——導出“golden server”狀態到SCP XML文件——針對即將部署的服務器型號編輯SCP XML文件——為自動化配置而設置DHCP服務器——新服務器使用DHCP自動化配置——新服務器使用一致的配置來操作。
除了通過網絡來批量部署之外,iDRAC Direct功能用于在單一服務器上,使用U盤里的配置文件來執行13G服務器的設置。
這種方式不需要網絡連接、DHCP服務器和文件服務器,使用場景包括:一次性驗收測試、測試和開發環境,以及在遠程位置的技術支持人員。
“無狀態服務器池”解決云計算難題
上圖介紹的是通過OpenManage Essentials軟件來實現批量部署,從單個服務器配置模板“1:M”生成多套服務器配置文件。
這里的虛擬MAC地址、WWN、WWPN和iSCSI Initiator是做什么的呢?首先,在一定范圍的服務器配置中(對網卡/HBA有要求),這些是可以在Firmware層面設置或者修改的。其目的是實現“無狀態服務器池”的部署,提升非虛擬化服務器的可移動性。
“Virtual IO Management and Stateless”一個比較成熟的應用是SAN Boot,包括使用iSCSI和FC/FCoE,這在刀片服務器環境中使用的多一些。如果我們把思路放寬,在云計算IaaS資源池中也有對物理服務器自動化管理的需求,而這正是戴爾OME Server Configuration Management的用武之地。