故障率低于業界15%,阿里質量大獎與騰訊最佳供應商榮耀加持,通過FMEA、HALT與EMC等高大上測試的檢驗,這一切描述的是華為服務器。
憑借創新、可靠、安全、開放四大原則,華為服務器秉持“持續創新 讓計算變簡單”的理念,連續7個季度出貨量排在全球第四,覆蓋金融、政府、互聯網服務提供商與大企業。
華為服務器擁有穩定可靠、綠色節能、性能領先、持續創新和基于業務優化的特點,為企業關鍵業務保駕護航。這是如何做到的呢?
設計:精益求精
在華為看來,高質量、高可靠性的服務器是設計出來的。例如獲得挑剔的日本客戶認可的華為FusionServer RH8100 V3關鍵業務服務器,憑借創新的高可靠性設計、靈活擴展能力和卓越的計算性能,在Interop展上贏得了“BestofShowAward”大獎。它采用RAS2.0技術,包括電源、風扇等關鍵模塊的熱插拔技術、全冗余的硬件和軟件設計架構,以及提升管理維護效率的“黑匣子”等。
華為FusionServer RH8100 V3
同時,使用高可靠硬盤設計,實現服務器內存和硬盤的自動裝配,減少內存、硬盤人工裝配引發問題的幾率。再如華為刀片服務器E9000采用無源背板設計,進一步提升可靠性,避免單點故障,同時使用獨立風道設計,耐40度高溫,有效地保障了企業用戶關鍵業務的連續性。
材料:精挑細選
服務器的用材決定著服務器的品質。這不僅僅是外表的健美結實,也包括強勁的內涵。
華為每一臺服務的材質都采用電信級器件,質量等級高于業界標準。同時,堅持被集成戰略,利用EMS(電子制造服務)廠商實現產品設計、代工生產、后勤管理、產品維修等服務。
為了掌控整個流程,華為實現嚴密的稽核制度,不定期稽核供應商,并派駐全職駐廠稽核人員。實時監控EMS廠質量數據,如質量數據異常會及時處理。特別是在硬盤與內存這種容易出錯的領域,華為會將報錯較多的問題讓供應商進行出廠前測試,逆向推動供應商改進產品質量。
此外,采用器件降頻設計。主要實現高頻的配件以較低的頻率工作,從而達到穩定工作的目的,解決頻率過高帶來高發熱和系統不穩定的問題。主要作用是省電,實現節能減排,還能減少維護工作。
質量:固若金湯
有一個水桶,它是由許多塊木板箍成的,盛水量也是由這些木板共同決定。如果其中一塊木板很短,則盛水量就被短板所限制,這就是我們所熟知的短板理論。
HALT(highly accelerated life testing,高加速壽命試驗)由美國軍方延伸出的一種設計質量驗證與制造質量驗證的試驗方法,主要用于產品研發設計階段,對于暴露產品的潛在缺陷效果明顯,是設計工程師提高產品可靠性的重要實驗手段。
華為引入HALT測試,利用包括振動、高低溫、溫度循環、電力開關循環、電壓邊際及頻率邊際測試等階梯應力,高效激發產品可靠性潛在缺陷,識別產品的短木板,將設計問題在研發階段暴露,發現產品缺陷、操作設計邊際以及結構強度極限的方法,涉及到線路設計、工藝、元部件與結構等方面。它將原來需要花費一年的新產品可靠性實驗縮短到一周,所發現的產品問題與客戶應用后所發現的問題一致,是華為新產品上市前所必需通過的驗證。
不僅如此,華為還采用FMEA(Failure Mode and Effects Analysis,失效模式與影響分析)這種可靠性設計方法,發現、評價產品或過程中潛在的失效及其后果,找到能夠避免或減少潛在失效發生的措施并且不斷地完善。能夠以低成本對產品或過程進行修改,并找到能夠避免或減少這些潛在失效發生的措施。
為此,華為專門成立一個FMEA團隊,包括生產總監、工藝工程師、產品工程師、測試工程師、質量工程師、材料采購員以及項目經理,由質量工程師領導該團隊。從而搭建相應的失效分析平臺,配備適當的分析工具。
當產品在HALT實驗中出現故障時,分析并確定產品出現故障的根本原因及影響,優化故障管理能力。對于嚴重故障,要求避免。對于需要處理的故障,要求能檢測并定位到FRU((field-replaceable unit,現場置換單元),讓用戶或技術員快速輕松地拆下電路板或零件并重新安裝,使系統停止運轉的時間減少到最小并且使系統可靠性達到最優。
測試:千錘百煉
真金不怕火煉,每一臺華為服務器在出廠之前都經歷了嚴酷的測試。涉及部件、整機、性能、兼容、系統等多個環節。展示了華為服務器各個關鍵部件在各種極端環境下的亮眼表現。
其中,電磁兼容(EMC)是對電子產品在電磁場方面干擾大小(EMI)和抗干擾能力(EMS)的綜合評定,是產品質量最重要的指標之一。華為的服務器產品采用超過業界標準的EMC試驗,確保服務器產品在共同的電磁環境中能正常工作。
例如,在暗室中模擬自由空間的標準化測試場地,確定受試設備是否滿足標準規定的輻射發射與輻射抗擾度限值。同時,模擬自然雷擊放電,測試設備在指定試驗條件下是否滿足標準規定的限制。
通常,服務器出廠前的整機拷機測試為2-4小時,而華為服務器測試為8-24小時;業界普遍采用隨機扇區讀寫測試,華為的拷機測試項目眾多,包括執行全盤讀、全盤寫測試;在內存拷機測試中,只要出現一次ECC報錯,產品就不能通過測試;內存出廠前,會做金手指清洗,減少金手指接觸不良問題。
流程:盡善盡美
從設計、選材、生產、測試、出廠,華為擁有一套完整的流程監控并保障服務器的質量。例如使用IPD((Integrated Product Development,集成產品開發)理念縮短產品研發周期,提升產品質量,降低成本。與此同時,服務器基于電信設備生產平臺,制造起點高,贏在起跑線上。
同時,華為服務器擁有全球專業的檢測認證中心GCTC,具備全流程嚴苛質量管控。任何“風吹雨打、火燒電擊、沙塵鹽霧、高壓低溫、沖擊跌落、輻射霉菌”等嚴酷測試,都不能阻擋華為服務器成為品質卓越、質量可靠、令人信賴的產品。