摘要:數據中心行業標準機構Uptime Institute研究所首席技術官Christop herBrown表示,困難環境的強化系統正在成為一個更主流的問題。隨著社會越來越依賴計算和通信技術,衛星通信,GPS,計算機輔助飛機導航等,這種研究在幾個小眾領域用之外的地方越來越相關。
日前,向國際空間站補給物資的Space X Dragon飛船帶來了一些新的東西:第一臺飛往太空的商業電腦。通常,用于太空任務的計算機是專門設計的,可承受從飛船起飛的超重力到零重力,以及宇宙輻射的所有方面嚴苛的考驗。而地球的上數據中心的服務器卻不能承受這樣的環境。Hewlett Packard Enterprise公司去年收購超級計算機供應商SGI公司,該公司首席技術官EngGoh博士說,可以進行太空旅行的加強計算機的推出可能需要數年時間。
Space X Dragon航天器2016年4月經過迪拜上空
Goh在接受行業媒體采訪時表示:“人們花了很長的時間來強化在這些惡劣的空間環境中使用的電腦,但這些電腦比較老舊,因此性能差距很大。對于某些任務來說,可能會花費更多的時間來強化系統,而不是強化使用。”然而,專門的一次性硬件的成本是很昂貴的,通常不會獲得規模經濟技術通常提供的優勢。
Goh希望為宇航員提供最新的可用硬件,能夠加載通用計算程序的標準軟件,以及智能的自適應控制,將系統強化的負擔從硬件轉移到軟件。HPE公司發送到空間站的兩臺水冷Apollo40已經運行了一年,這兩臺服務器從工廠生產出來時,并沒有對硬件進行強化,進入太空軌道后,通過了NASA測試,不需要修改,這意味著其服務器應該在其他惡劣的環境也會運行得很好。
像Goh所說的那樣,太空的服務器是一個實驗,可以發現太空中的惡劣環境對未強化硬件的影響,以及在軟件中可以做些什么來減少這種影響。這個想法是在檢測到更高級別的操作時,減少服務器的功耗和運行速度,看看是否足以使它們運行。“可以使用軟件來硬化計算機嗎?這就是我們想要得到回答的問題。”
數據中心行業標準機構Uptime Institute研究所首席技術官Christopher Brown表示,困難環境的強化系統正在成為一個更主流的問題。隨著社會越來越依賴計算和通信技術,衛星通信,GPS,計算機輔助飛機導航等,這種研究在幾個小眾領域用之外的地方越來越相關。Brown說,“真正超越了非常專業化的人員和群體的邊緣,在某種程度上它會影響到所有的人。”
太空和地球上的計算機的經驗教訓
Space X Dragon飛船上的服務器位于與電源,以太網和冷凍水系統相連的儲物柜中。這個方便的儲物柜不是為了保護機器而設計的,則只是為了存儲它們。服務器部署了SSD硬盤,不會受到零重力和電離輻射影響,安裝了體積較小的快速驅動器和運行較慢的驅動器,以便在太空中更好地工作。此外還有Infiniband互連,因為銅連接可能比光纖更容易受輻射影響。該團隊沒有調查CPU,內存和SSD參數,而服務器運行在標準版本的RHEL 6.8操作系統中。
通用服務器將對未來的宇航員有用,因此像HPE這樣的公司,這是一個有趣的潛在增長市場。Goh指出,“如果商業太空旅行與航空旅行相同,那么其市場并不小,探索空間也是人們真正需要邊緣計算的地方。如果我們向火星派遣一支遠征隊,那么20分鐘的延遲將意味著地球的系統不適合任何實時處理,如圖像識別或預測分析。”
但而從太空應用得來的經驗教訓在地球上的應用也是有用的。HPE公司希望把它學到的東西應用到惡劣的地球環境中,并通常教電腦來更好地照顧自己。Goh說:“更高層次的目標是讓計算機能夠通過傳感器和預警系統來適應自己的環境如今,人們為反病毒預留了一些計算周期;還應該留出周期讓計算機自己照顧自己,保護自己。如果你說每秒有10億次操作,那么人們愿意為防病毒預留0.5%,那么是否可以提供5%到8%給自我護理?”
微軟在另一個極端環境中的探索
這些目標與微軟公司Project Natick的目標相似。當微軟公司的研究人員從微軟Azure數據中心將一個42U機架的服務器內罩上一個密封的外殼,并將其沉入離岸邊半英里的海底沉沒時,其中的一個目標是學習如何在任何環境加速部署數據中心。
“如今,部署一個大型數據中心需要很長時間,”Natick項目研究人員Ben Cutler表示,“可能需要兩年時間,因為企業必須找到一些地方來部署數據中心,首先必須獲得建設數據中心的土地,必須得到許可證,建設建筑。即使擁有各種各樣的千篇一律的數據中心,仍然要面對這樣一個事實:土地不同,氣候不同,工作規則和建筑規范都不同,電力的來源是不同的。此外,還需要很長時間。”
有時云端服務需求在一個意想不到的地方出現了高峰,而微軟公司希望盡可能快地做出回應,Cutler繼續說道,“我們的目的是在90天內完成數據中心計劃到運營,是否可以達到在世界任何地方規模化部署數據中心的能力?”
微軟試驗性水下數據中心Project Natick正在在加利福尼亞沿岸部署
出于同樣的原因,微軟公司開發了在新的Azure數據中心直接安裝并完全部署的機架。Cutler指出:“我們通常不會做的事情是將建筑視為制成品。采用筆記本電腦或手機,人們幾乎完全知道如何運作,以及在構建之前花費多少錢,你可以快速得到一個數據中心,因為在你訂購時,它被拉出機架并運送到某個地方。我們想要在數據中心方面做出同樣的事情。”
設計用于人工操作
海洋并沒有像太空那樣苛刻的環境,但它比陸地濕潤,并會遭遇颶風,溫度波動等惡劣天氣和環境。這意味著從長遠來看,在水下可靠運行的數據中心的成本將會比陸地上的數據中心成本更低。一方面,其冷卻成本是目前冷卻成本的20%。Cutler表示,如今的數據中心主要依靠空氣冷卻,這意味著它們比較溫暖。“我們的假設是,如果IT設備環境的溫度一直很低,那么失敗率也會更低。”
服務器故障率在這里具有一個全新的層次。水下數據中心將是密封單元,其設計為在維護服務器的五年甚至十年的整個工作期間無需維護。“從歷史上看,如果每年都會有對服務器進行更新,故障率并不重要,”Cutler說。然而,如今的硬件并沒有像以前那樣快速地更新硬件,而是可以在更長的時間內運行硬件來降低成本。
但水下數據中心沒有人能夠進入進行維修,Natick數據中心內充滿了氮氣其,內部幾乎沒有濕度,其濕度對硬盤來說并不全是壞處,數據中心故障的主要原因之一是電子設備中連接部分的腐蝕。隨著時間的推移,濕氣會導致設備中兩個金屬片之間短路,最終導致故障。但也不能使空氣太干燥,因為某些硬盤驅動器會使用電機潤滑脂和一些水分。如果低于10%的濕度,那么這些潤滑油脂就會變成粉末,就會出現另一種故障。”
密封的機架可以消除灰塵問題,因此不需要空氣過濾器,而且機架部署可以更簡單,在其磁盤和服務器刀片連接使技術人員能夠快速拆分并將其放在一起。所有這些方便的訪問都有額外的費用。
不需要數據中心的工作人員維護可以防止自身的許多問題。“通常在數據中心的維護過程中會發生一些故障。”Cutler說,“如果人們在某個區域工作,通常在一定的時間后開始看到區域的的失敗。每當人們觸碰到一些東西,都有一些風險,而其他的設備也會受到影響。”
對于某些需要邊緣計算的場景,無論是在太空中,在石油鉆井平臺上還是在礦井下,密封單元看起來都是一個很好的選擇。在對石油鉆井平臺進行地震勘測后通常會將存儲在硬盤驅動器上的數TB數據返回總部進行處理。將處理工作量移動到鉆機本身可以給出更快的結果。
Cutler說:“海面鉆機可能會消失,將成為海床上的自動化平臺。但需要更多的計算能力來完成這項工作。”
微軟公司和HPE公司正在致力實現太空和海底的數據中心的全面自動化,其技術也可以促進標準的數據中心技術發展,無論是通過自動化和自我修復軟件,還是密封單元。Cutler說,微軟公司內部的團隊已經在考慮如何將Project Natick海底數據中心的應用于設計公司在陸地上的數據中心。“我們將所有這些技術帶來微軟公司內部的數據中心設計領域,并嘗試了解這些技術和應用是否有意義在陸上部署,以帶來經濟優勢,無論是更環保還是成本更低。”