導語
夏日的夜晚,當望著星空腦海中就浮現出后羿射日、女媧補天、夸父追日、嫦娥奔月等等故事,這些神話總是生動地展示古人對神秘宇宙的努力探索。每每聽到我們的宇宙飛船在太空有新的消息,都會激動不已,這是人類孜孜追求的事情,在現代科技文明變得越來越明朗。
載入史冊的時刻 37年來首次月面軟著陸
回顧中國嫦娥三號探測器奔月之旅,環繞月球,并登陸月球,由著陸器和“玉兔號”月球車組成的嫦娥三號在月球虹灣地區降落,當月球車目前已成功探測并傳送有關月球表面形貌,地質構造,礦物及化學成分的數據和三維圖像時,我們實現了最近37 年來的第一次月面軟著陸,這一時刻載入史冊。
中國的探月工程分為“ 繞、落、回”三個階段,時間跨度從2007年到2020年,但其實測器的軟著陸是登月計劃中最困難的一項任務。即2015年以后, 研制和發射小型采樣返回艙、月表鉆巖機、月表采樣器、機器人操作臂等, 采集關鍵性樣品返回地球, 對著陸區進行考察, 為下一步載人登月探測、建立月球前哨站的選址提供數據資料。此段工程的結束將使我國航天技術邁上一個新的臺階。
最困難任務背后的“核心團隊”
落月過程中,中科院上海天文臺在跟蹤、測量、監視探測器動力下降時扮演了關鍵的角色。如此重大意義的工程背后必然有更強大的數據中心作支撐!
此前,天文臺搬遷到一個新數據中心并向幾個供應商咨詢有關適用于嫦娥三號探月基礎設施的技術要求。中科院上海天文臺選定長期合作伙伴戴爾作為數據中心的重要供應商。通過與戴爾基礎架構咨詢服務合作,天文臺設計并配置了能夠滿足其帶寬,高強度計算,以及性能需求的解決方案。
在追蹤嫦娥三號登月之旅的過程中,中科院上海天文臺負責其中的甚長基線干涉測量(VLBI ) 系統,是追蹤嫦娥三號奔月的幾個子系統之一。它由五個大型射電望遠鏡組成一個網絡,不斷地測量探測器軌道與位置信息。該VLBI 系統需要高性能計算集群進行實時數據傳輸、存貯及處理。
?戴爾卓越HPCC方案——保障奔月之利器
20 天的精密衛星軌道實時追蹤, 60秒內的實時數據處理、結果傳送。
中科院上海天文臺VLBI 指揮控制中心副主任設計師陳中說,“ 我們的任務是在為期20 天的精密衛星軌道追蹤中,進行數據的實時測量并把結果傳送到北京航天飛行控制中心。該中心對探測器發送命令使其安全地自行控制降落。在這個過程中,我們用射電望遠鏡收集了大量的數據并依靠HPCC 進行處理,同時在不到60 秒的時間內把所需的計算結果傳送到控制中心。”
?戴爾卓越HPCC——包含什么內容?
陳中這樣解釋,“ 我們花了相當多的時間與戴爾在項目的早期測試HPCC 解決方案,并確保它符合我們的具體要求。戴爾能夠提供完整的端到端解決方案,包括硬件,軟件和涉及在月球軟著陸的密集期所需的特定支持服務。”
這套解決方案包括了采用戴爾 PowerEdge M1000e 刀片機箱的可擴容的、高密度的戴爾 PowerEdge M620 、R720 和 R910 服務器,確保高可用性、高效準確的數據處理以及數據中心空間的充分利用。
與此同時,戴爾網絡M6220 交換機和 Mellanox M6301Q 交換機確保天文臺可以滿足嚴格的要求,提供40GbE 網絡帶寬。該解決方案還包括戴爾PowerVault MD1200 直連存儲和戴爾Precision T7500 塔式工作站,用來監控天文臺與北京控制中心的視頻流。減少碳排放也是數據中心的一個核心目標,通過部署戴爾刀片服務器所實現的能源節省滿足了上海天文臺的需求。
“ 我們很高興能夠與戴爾長期合作并討論我們的技術需求。在這個過程中戴爾團隊成為值得信賴的顧問,使我們能夠制定相關要求。基于他們的專業精神和高超技術,我們選擇了戴爾作為我們的合作伙伴。” 陳中說道。
?降低探月潛在風險—— OME主動監控探月進程的高級系統管理控制臺
OME是Open Manage Essentials系統管理控制臺解決方案的簡稱,簡單又強大!
為了確保天文臺團隊可以監控基礎設施并提供積極主動的支持,他們安裝了戴爾OpenManage Essentials 。以往每臺機器都需要人工監控,但OpenManage 的系統管理控制臺卻提供了簡單、自動化的硬件管理。
通過使用Open Manage ,戴爾團隊在項目啟動前一個月檢查了所有的基礎設施并對所有固件進行升級。這兩項任務有助于大大減少可能影響探月任務的潛在風險。
數據中心成功實施幾個月后,HPCC 平臺在籌備降落月球所需的數據處理過程中發揮了關鍵作用。探測器數據通過網絡實時傳遞到 HPCC 的處理平臺,接著轉發到后臺系統進行精細處理和分析,以便在降落月面時減少風險。
另外,通過與戴爾團隊的廣泛規劃,天文臺消除了單點故障帶來的風險并實現了高可用性。為了確保天文臺滿足其應用程序的I/O 密集需求并避免HPCC 的 NFS 瓶頸,該解決方案利用Lustre的并行分布式文件系統,通過在四個存儲節點傳播數據來提供冗余。這意味著在落月時用來控制探測器所需的數據即使系統發生故障也仍舊可以保持高度可用。
陳中表示:作為整個過程的中間點,HPCC提供了一項關鍵的功能。在系統完全不宕機的情況下,我們實現了高可用性,同時滿足了實時數據的要求以及對探月工程的承諾。
世上前所未有的復雜任務 戴爾通過技術助攻關
中科院上海天文臺的 VLBI 數據中心把從嫦娥三號衛星接收到的數據經過復雜處理,然后發送到北京控制中心的時間差距從之前嫦娥二號執行任務時的 10 分鐘降低到 1 分鐘之內。
但,戴爾HPCC解決方案則有更大的突破!
陳中說道,“HPCC 有著實時數據的要求。我們需要數據在 60 秒完成多點數據接收、海量數據處理分析和實時發送,此項時間框架是世界上前所未有的。但我們通過技術攻關,開發新算法,并配合戴爾的高性能硬件實現了快速傳輸數據的目標,最快時只用 15 秒。 較為復雜的任務,比如在特殊的弧段,則需要大約 45 秒傳送。”
由于包括中科院上海天文臺的VLBI 網絡在內的一系列系統所提供的數據,嫦娥三號探測器得以安全在月球表面著陸。著陸過程中所觀測的數據將用于正在進行的科學研究,并支持未來的月球探測。
對于此,陳中用北京航天的賀電來表達他對戴爾的贊賞,賀電稱:“在任務準備和執行過程中,中科院上海天文臺發揚科學求實精神,嚴慎細實,攻堅克難,為任務的圓滿成功作出了卓越貢獻。”
真正白金級別 戴爾ProSupport Plus的關鍵意義
陳中的贊賞除了過硬的解決方案,還包括戴爾設立的一個專屬應急團隊,這個團隊支持嫦娥三號的探月任務。在技術客戶經理的主動協調下,該團隊在探月任務開始之前采取一系列預防性的措施,確保在任務執行階段把服務響應時間和解決問題的時間降低了一半。
ProSupport Plus的意義就在于,能夠立即診斷并積極解決可能影響任務的任何問題。零宕機很好地證明了該團隊為天文臺所提供的服務。
而這支團隊在整個探月過程中提供高品質的ProSupport Plus 白金專業支持服務,確保VLBI 關鍵系統的穩定性。在關鍵任務執行階段,戴爾提供了 HPCC 備件并派遣幾位工程師到VLBI 數據中心,以便快速解決任何由于部件故障引起的意外情況。
如今,探月第三期工程的目標是月面巡視勘察與采樣返回,其中前期主要是研制和發射新型軟著陸月球巡視車。而戴爾與中科院上海天文臺的高性能計算集群平臺,將繼續助力中國探月工程圓滿完成既定任務!
結語
戴爾通過HPCC 平臺滿足航天任務的長期技術要求、高可用性助力關鍵系統控制落月;數據可以在低至15秒內從上海天文臺傳送到北京控制中心、通過比以往快一半的響應速度消除宕機時間、成功軟著陸。
戴爾 - 致力于通過卓越技術為正在進行的科學探測服務!