精品国产一级在线观看,国产成人综合久久精品亚洲,免费一级欧美大片在线观看

高可用是個技術活 也是個經驗活

責任編輯:editor007

2015-07-06 17:36:12

摘自:藝術培訓信息

如果問用戶對服務器的基本需求是什么,可能每個用戶都會說“不停”,沒錯,尤其是對于可支持8顆處理器以上的高端服務器而言。

如果問用戶對服務器的基本需求是什么,可能每個用戶都會說“不停”,沒錯,尤其是對于可支持8顆處理器以上的高端服務器而言。

高端服務器承擔的應用場景都是核心的數據庫、中間件等關鍵應用場景,計劃外停機往往伴隨著業務災難。系統連續運行水平在計算機領域通常稱為“可用性”、“RAS”特性(Reliability, Availability and Serviceability)。目前,高端服務器普遍需要提供99.999%的高可用性,也就是每年停機時間不超過5分鐘。

“不停”的核心是高可用

“不停”不僅要可靠,更要高可用,也就是對各個層面錯誤的容忍。高可用是服務器設計研發工作者首先考慮的問題,服務器是一個龐雜的系統,可靠性再強的系統都難免出錯,一個能夠容忍各類錯誤的服務器才能稱得上是高可用系統。

簡單理解,高可用就是隔離故障對系統影響的技術,包括故障的自動化監測、備用部分切換和故障記錄分析等,其基本思路是,就是周期性的對服務器不同層面進行檢測,在故障影響系統運行之前將其發現,然后將故障部分執行的任務遷移到備用或者同級部分上,并對故障部分進行修復、記錄和報警。

高可用也是個力氣活

高可用一直被認為是服務器系統高級的特性,此前,大多高可用技術都僅應用于大型機和傳統的小型機上,一直是“高大上”代名詞,而且高可用技術也一直是各個服務器廠商的核心競爭力之一。

從一個筆者的工作體驗來講,高可用技術都是研發難度最大、復雜度最高的技術類別之一。舉一個簡單的數字,目前品質最高的工業級電子器件平均無故障時間在10000小時左右,浪潮天梭TS860大約有幾萬個電子器件,如何保障“不停”是個挑戰。這僅是最基本的元器件層面的挑戰,此外,還有信號、板卡、BIOS、部件等其他各個層面都要詳細考慮。

可用性也是個經驗活

高可用需要部分資源閑置作為熱備份,因而會造成服務器效率的下降,例如較為常用的硬盤RAID 1技術,兩塊硬盤同時寫入,硬盤空間的利用率僅有原來的50%。為了不過多的損失效率,大部分產品會采用一對N共享熱備技術(就是多部件共享一個熱備件,例如內存熱備通常是三個內存槽位共享一個熱備槽位)、互享熱備等技術。服務器系統的復雜性決定了熱備策略、技術措施的復雜性,每個廠商的高可用技術都體現了各自的理解,凝結著各自工程師的實際經驗。即使是相同的高可用技術,各個廠商的具體實現方式方法也不太相同。高可用技術需要廠商在核心技術方面的長時間通入,需要廠商在服務器設計研發方面長期的摸索和積累。

天梭TS860的高可用——體系化

天梭 TS860采用了體系化的可用性技術,在芯片級、鏈路級、模塊級、系統級等四個層面共采用了60余項具體的高可用技術,這些技術包括最底層的雙工信號傳輸,一直到部件級別的熱替換,使系統的可用性水平超過99.999%。硬盤、網卡、風扇、電源等模塊都支持熱插拔,用戶可以在系統不停機的情況下,更換這些部件。

  浪潮天梭TS860

相比上一代產品,天梭TS860的傳感器數量達到了500個左右,可以及時探測系統各類信息,另外,還增加了Live Error Recovery(LER),eMCA,Machine Check Architecture Recovery(MCA-R)等復雜高可用技術,并且對CPU、內存的onling/offline,PCI-E熱插拔等方面進行完善和改進,使系統高可用機制更加完善。

  更好的熱容忍,可部署40度高溫環境

從實際應用看, 服務器運行最大的挑戰是不受外界關注的一個基本問題——散熱,內部溫度過高會使得部件過熱,觸發宕機,也會影響部件壽命,為服務器運行埋下長期隱患。

天梭 TS860采用了CPU Thermal Throttling技術,CPU一旦超過一定的門限溫度,會自動降頻降壓,以降低自身溫度;與此同時BMC通過調整風扇轉速,幫助過熱的CPU散熱。

而且天梭 TS860風道設計上進行了優化,兩個獨立硬件分區有各自獨立的風道,不會相互影響。硬盤和電源的風道也獨立出來,整系統風道清晰,流暢,散熱性能好,可靠性高。

  浪潮版的SMART,更好地硬盤管理

SMART即Self-Monitoring,Analysis and Reporting Technology,是硬盤自我檢測與分析報告技術。SMART技術提供的數據,包括壞道、內部溫度等,必須通過硬盤的接口(SCSI、SATA、SAS等)讀取,通過這些數據,可以迅速了解硬盤的健康狀況。

大部分廠商的服務器產品都是各個硬盤均與RAID卡連接,然后接入服務器系統。這一方式使得服務器無法直接訪問硬盤的接口,也就不能讀取每個硬盤的SMART數據,無法判斷硬盤的健康狀態,尤其是作為服務器帶外管理核心的BMC,更是無法獲得硬盤的任何信息,這個問題一直困擾各大服務器廠商。

天梭 TS860的硬盤背板,采用了智能的硬盤監控芯片,解決了硬盤無法監控的問題。RAID卡具有標準的SGPIO總線,硬盤監控芯片能夠通過該總線,獲取每一個硬盤的工作狀態,并能夠將這些狀態通過SMBUS發送至BMC,這樣硬盤納入了統一的系統監測和管理,使得天梭TS860的高可用更為體系化,便于制定更好的策略。

高可用技術完善在于細節

高可用技術的成熟往往體現在具體的細節。以最常見的風扇冗余為例,天梭 TS860系統在處理風扇故障過程中,為了減少噪音沒有輕易啟用冗余風扇,而采用了一套更合理的風扇故障處理技術:當有風扇出現故障時,監控管理系統會立即響應,通過底層硬件實現對系統的局部的降頻降壓,保證系統不會因為過熱而死機,并通過報警的方式提醒用戶更換故障風扇。

用戶自選的可用性水平

天梭TS860的可用性技術主要以一對多熱備為主,但是很多部分也為用戶提供了不同的選擇,例如電源系統支持雙路供電,可提供N+N/N+1等多種冗余方式,用戶可以根據業務的關鍵性采用不同的方案。

近年來,各個行業的用戶對于四路以上的高端服務器越發青睞有加,一方面,隨著云計算、移動互聯、BYOD等新一代信息化應用的發展,用戶業務系統的訪問壓力和數據增長速度都在不斷攀升,另一方面,對于一些壓力不大或者邊緣系統,用戶為了簡化管理,降低成本,都開始采用虛擬化和云計算技術進行整合。

浪潮是中國最大的八路X86服務器供應商,將會進一步把關鍵應用主機的高端技術下移到八路至強平臺,為客戶帶去更好的應用價值和體驗。

鏈接已復制,快去分享吧

企業網版權所有?2010-2025 京ICP備09108050號-6京公網安備 11010502049343號

  • <menuitem id="jw4sk"></menuitem>

    1. <form id="jw4sk"><tbody id="jw4sk"><dfn id="jw4sk"></dfn></tbody></form>
      主站蜘蛛池模板: 宜州市| 彭山县| 河北省| 怀宁县| 礼泉县| 黄大仙区| 灌南县| 静安区| 海兴县| 岳池县| 东辽县| 邛崃市| 鹤山市| 武乡县| 漳平市| 石屏县| 安国市| 西青区| 清水河县| 东山县| 临朐县| 枞阳县| 万安县| 漳平市| 木兰县| 泗水县| 建德市| 西乌珠穆沁旗| 会泽县| 民丰县| 永兴县| 珲春市| 兴安盟| 苍溪县| 土默特左旗| 论坛| 汤阴县| 淳化县| 鸡泽县| 肥西县| 峡江县|