8月18日原創報道: 8月13日下午14:30,DOSTOR獨家發起圍繞“Flash evolve Datacenter 閃存進化數據中心”為主題的網絡沙龍活動圓滿結束,沙龍現場邀請到國家信息中心專家委員會主任、研究員寧家駿、Gartner大中華區首席存儲分析師張瑾、國家審計署計算機技術中心技術推廣處副處長裴曉寧、中國農業銀行總行清算中心經理王正江以及華為的兩位專家。沙龍互動熱烈,共有348名在線網友參與,收到提問639條。在閃存時代,也相信很多網友有著不少疑問,特別是企業存儲十年轉型,閃存從中帶來了什么動力?閃存在加速數據中心過程中到底扮演什么角色?閃存可靠性方面到底需要注意什么?華為閃存策略又有哪些與眾不同的地方?
企業存儲十年轉型與閃存有何關系?
數據中心經歷10年左右的發展,從數據孤島到數據集中,再到對存儲提出更為高標準的要求,存儲效率與價值的發揮已經成為企業用戶關注的焦點之一。
國家信息中心專家委員會主任、研究員寧家駿也贊同這樣的觀點,對于數據中心十年發展的轉型,他進一步分析道,大型數據中心轉型主要經歷了三個階段,第一個階段是大型機階段;第二個階段就是當前以服務器為主構建數據中心的階段;第三個階段進入以云計算為代表的數據中心階段,包括軟件定義數據中心階段。隨著企業用戶數據量爆發增長,如何做到數據更高效利用和數據的安全關鍵是存儲的穩定運行,這成為數據中心發展過程中最重要的事情。
不過,在談到這方面的問題時,Gartner大中華區首席存儲分析師張瑾明確指出,在摩爾定律與服務器虛擬化技術的快速演進過程中,CPU、網絡都獲得很快的發展,而存儲長期依靠機械硬盤早已遠遠跟不上前兩者的發展,從而存儲成為數據中心發展的瓶頸,一些新的存儲技術出現成為必然,包括閃存的出現。包括大數據的應用對于存儲的需求在增加而沒有減少,為此,對于企業用戶來說如何在有限資金下提升存儲效率成為很重要的話題。
可見,來自兩位專家的觀點都充分表明,閃存的出現帶來了數據中心存儲的新動力,但閃存是否能重塑數據中心?張瑾認為,閃存實際在顛覆傳統存儲的技術架構和競爭格局,從現在來看,主流廠商是被動或半主動地推出閃存策略,既然有這么多對于閃存的投資,未來閃存將會有突飛猛進的階段。在軟件定義架構的理念推動下,必然使得主流廠商更為重視這方面的發展。
另外,從企業用戶層面來分析,在衡量閃存應用的標準時,國家審計署計算機技術中心技術推廣處副處長裴曉寧認為主要關注其安全性、可靠性和性價比,不過對于安全性方面應該是放在第一位。
對于談到企業用戶存儲及閃存需求方面,華為存儲產品線高級營銷經理張秦筠認為企業對于存儲的需求要滿足三點,一是存儲性能要能與企業業務匹配;二是存儲是否可靠,管理簡單;三是在總體擁有成本方面給企業帶來益處。在他看來,閃存的出現,可以提供存儲系統更低的時延,并給業務系統提供更快的保障。如何在閃存系統上提供更好的可靠性,相對于傳統機械硬盤比較,閃存在性能容量比、性能能耗比、性能空間比上都具有天然優勢,充分發揮閃存與系統之間的優勢可以成為企業數據中心發展中非常好的選擇。
為什么強調閃存是數據中心進化的催化劑?
當然了,對于閃存進化數據中心不可能一蹴而就,那么閃存在數據中心演進過程中到底扮演什么樣的角色,發揮著什么樣的作用呢?
當前,傳統存儲陣列逐漸變成了虛擬化基礎架構的性能瓶頸,直接限制了虛擬化基礎架構的效益最大化。華為存儲產品線高級營銷經理張秦筠認為,閃存及其構筑在其上的相關產品的出現,為存儲系統的性能提升,給出了一個嶄新的解決方案,閃存本身并不能解決虛擬環境中出現的復雜數據管理問題,但提供了一種可能。那么,閃存產品、閃存系統以什么樣的路線圖演進方式,進入到企業的IT基礎架構中去?
從1984年東芝正式公布Flash原理到現在,閃存技術已經走過了30年的發展歷程。最開始,閃存依靠高IOPS、低時延、低功耗、無機械部件的特點進入人們的視野,但在2008年開始才真正在企業級服務器和存儲領域取得商用,那時,僅僅是作為一個獨立部件對一些對性能有特殊要求的應用進行加速,它有效地拉近了計算與數據的距離,并解決了數據中心基礎架構虛擬化所帶來的I/O攪拌問題,是“良藥”。隨著工藝的不斷演進、密度的不斷提高、技術的不斷完善,以及價格的不斷下降,閃存產品已經不僅僅局限于對系統進行加速或者提升性能的單一部件優化層面。
在可以預見的2-3年內,閃存將會逐步取代SAS機械硬盤成為高性能盤的唯一選擇,圍繞著閃存與SSD進行設計的系統和特性將會越來越多地應用在企業的不同級別業務中。
張秦筠強調說,在整個數據中心的演進過程中,“簡”和“捷”是不變的話題,閃存在這兩個維度都帶來了巨大的沖擊,從服務器計算效率、到網絡傳輸效率,再到供電、散熱等。閃存作為一種催化劑,促進了整個數據中心的變化。
面向未來,數據中心將逐步演進成為由上層軟件堆棧定義下的能夠自適應的下層統一的IT基礎設施所構成,由軟件按需使用硬件資源,以最高效的方式使用硬件資源。閃存將進一步促進數據中心更上一個臺階,催生計算與存儲的聚合,計算以最高效的內存訪問方式訪問存儲,存儲離CPU最近,徹底消除CPU與存儲介質之間的性能鴻溝。未來的企業數據中心,將從計算、網絡到存儲的各個路徑做好適配,數據中心效能極大提升,將硅片上構筑的計算與存儲效能發揮至極致,實現物盡其用。傳統數據中心逐步步入“Flash”時代,即閃存進化下的企業數據中心——更高效、更可靠、更節能。
如何分析閃存可靠性的關鍵因素?
中國農業銀行總行清算中心經理王正江表示,作為一線用戶,最重視閃存可靠性,特別是在金融結算過程中,更是擔心閃存的可靠性,其次對于數據反映時間要求也非常高,每天金融業務處理上億筆,如何加快數據反映時間,對存儲速度要求就非常快。
在談到可靠性方面話題時,華為存儲產品線閃存系統架構師龔濤指出在數據中心中,計算、網絡、存儲都是非常明確。如何保證企業用戶業務連續性,成為閃存可靠性方面的關鍵因素。在這個方面,華為對閃存采取了錯時運行技術,快速復位固件(在一秒以內的秒級復位),起到定時器作用,達到SSD運行時長錯開,一旦有SSD盤有問題發生,就只是單盤失效,而不會出現數據丟失,避免客戶業務中斷。在保護用戶數據業務連續性方面有著很大的作用,在SSD方面能有這樣功能的廠商華為做到了領先。
另外,如何保障閃存硬件具備可靠性?那么需要對閃存故障模式有深入的了解。從2007年到現在,華為在閃存方面做了非常多的技術積累。首先,龔濤談到可靠性的故障模式,比如閃存顆粒隨機失效,華為盡可能減少顆粒的磨損和擦寫次數。同時華為采取全局容量冗余,使用軟件功能控制硬盤冗余比,達到整體系統可靠性。另外,減少顆粒磨損能提升SSD可靠性,但華為不僅如此,還采取了自研的全局反磨損均衡技術,在軟件管理系統里面顯示直接的磨損監控。同時犧牲小部分盤利用來爭取整體SSD盤的可靠性,從而不至于因SSD盤片全部失效而導致業務斷掉。
從實際出發,華為SSD配套陣列、服務器等都在出貨,所有SSD出貨量達到了數萬片,華為SSD年返還率是0.29%,而某友商SSD年返還率是0.44%,華為在SSD可靠性方面做了大量工作。再具體到華為全閃存陣列方面,到目前全閃存陣列出貨在數PB以上,從2010年到現在,沒有出現一起故障問題,沒有一片SSD返還,這得益于華為在閃存、陣列以及相互配合方面做了大量優化工作。
同時在業務不斷發展變化過程中,企業用戶越來越重視存儲的可靠性,要做到可靠性提升,盤和系統相結合是基礎。SSD是基于Nand flash來設計的,不是10k的SAS HDD,其工作方式和故障模式和機械硬盤存在很大的不同,SSD不受振動、腐蝕、平均利用率等因素的影響,但存在顆粒隨機失效、固件潛在bug、失效概率隨著磨損次數上升而變化等可能。對此,通過盤與系統更好的融合,可以為數據中心可靠性帶來最大的幫助,洞察存儲變化,提高存儲可靠性。
怎么看待華為閃存Flash first的1.0到3.0?
既然華為對于閃存可靠性有著這樣深入的理解和分析,那么在配合閃存帶給數據中心的演進方面,作為國內最早從事閃存研發的華為如何看待閃存的應用?華為閃存的總體策略又是什么樣的?相信這是諸多網友最為關心的話題。為此,華為存儲產品線高級營銷經理張秦筠針對這方面的問題給出了非常詳盡的解釋,華為公司一直以來就非常重視Flash在數據中心的應用,早在2007年,華為就洞察到閃存在逐漸演進的過程中給企業級用戶帶來的核心價值,開始投入到SSD領域的研發,并聚焦于將SSD與系統進行融合,以充分發揮SSD的特性。
“一直以來,華為和閃存顆粒廠商保持著良好的“戰略”合作關系,在自研SSD和SSD Controller方面,我們先后推出了三代SSD以及自研ASIC芯片。正是因為我們擁有自主研發的SSD,我們可以做到針對SSD的全局資源管理以及SSD與系統深度融合設計。另一方面,我們更看重如何在企業級應用中將SSD更好的用起來,在不改變用戶使用習慣的基礎上,將SSD系統與相應軟件功能更平滑地切入到現網環境。”
他進一步指出,華為在閃存方面的整體策略是Flash first,通過完美地在數據中心注入閃存基因,加速閃存在數據中心的布局,幫助數據中心完成整體進化。作為目前業界唯一一家同時自研SSD Controller、SSD以及SSD系統的廠商,華為通過將SSD相關的技術完美融合到數據中心的核心業務中,力求為企業提供更穩定的、更高效、更節能的SSD系統與解決方案。
基于以這個大方針為指引,華為提出了“Flash first”三步走的策略。
Flash first 1.0階段,關鍵詞:“加速”。從2008年到2012年,在這個時期,大多數數據中心存儲雖然在物理上集中,但業務還是獨立分散部署,Flash對數據中心加速,只是解決部分應用的性能問題。在這個時期,華為稱作Flash first 1.0階段,它的關鍵詞是“加速”。從這個思路出發,華為在2010年推出了應用在傳統陣列里的SSD Cache以及SSD Tier,以及基于SSD的全固態存儲系統Dorado,對數據中心的性能敏感的關鍵業務進行加速。目前,華為已經實現了Flash first 1.0的目標,進入到第二個階段的實施中。
Flash First 2.0階段,關鍵詞:“融合”。如前文所述,在主機虛擬化浪潮的推動下,數據中心建設模式由煙囪式走向資源池化,池化數據中心的大量業務并發運行,業務規模和業務種類動態變化,產生大量動態變化的隨機IO。客戶期望高性能、特別是高隨機性能的存儲資源池。與此同時,池化數據中心支撐大量的業務,一旦出現異常,將會波及很多業務;所以,客戶期望是高可靠、能自愈的存儲資源池。同時,在這一時期,隨著Flash規模應用,及Flash價格快速下降,逐步接近高性能HDD( 15K、10K轉速),使得Flash在企業級市場的大規模應用成為可能。Flash逐步替代高性能HDD盤,應用于主存,成為高性能盤的唯一選擇。而在這個時候,機械硬盤卻不會一下子從數據中心徹底消失,數據中心需要能融合高速的SSD以及大容量的HDD的融合架構。華為稱之為Flash First 2.0時代,它的關鍵詞就是“融合”。一方面,基于融合架構,通過多介質融合、多協議融合、跨設備融合、跨生命周期融合技術,推動Flash以平滑方式進駐數據中心,同時也是推動數據中心存儲資源池化的過程。而另一方面,存儲系統專為Flash設計,基于全局表項管理、全局動態均衡(全局容量冗余、全局磨損均衡、全局反磨損均衡)、全局壞塊管理等技術,提供超高性能、超高可靠的存儲服務。
Flash First 3.0階段,關鍵詞:“聚合”。在Flash First 3.0階段,華為認為數據中心走向All IP承載的軟件定義下的數據中心。通過全IP互聯,實現網絡高度融合與統一,不僅數據中心內部全IP互聯,數據中心之間全IP互聯,數據中心與終端之間也是采用IP互聯,數據基于統一IP網自由流動。軟件與硬件解耦,計算、存儲、交換基于通用標準硬件,由軟件按需使用硬件資源,以最高效的方式使用硬件資源。在Flash First 3.0階段,Flash將促進計算與存儲的聚合,計算以最高效的內存訪問的方式訪問存儲,計算與存儲的界限將變得模糊,存儲離CPU最近,徹底消除CPU與存儲介質之間的性能鴻溝。消除了以SCSI為核心的復雜軟件堆棧,徹底簡化編程模型,將硬件資源發揮至最高效。存儲與計算高度聚合,聚合成單一硬件節點,單節點具備計算、存儲、交換的能力,單節點是緊縮的數據中心。節點之間基于IP互聯,計算與數據跨節點自由流動,多個節點互聯就是擴展的數據中心。未來的企業數據中心,將從計算、網絡到存儲各個路徑做好適配,數據中心效能將得到極大提升,將在硅片上構筑的計算與存儲效能發揮到極致,實現真正的物盡其用。(阿明)
編者按:由此可見,閃存在數據中心演進過程中的不同階段也扮演著不同的角色。作為國內最先發展閃存的國產廠商華為,不僅重視閃存帶來的變化,而且對閃存進化數據中心的深刻理解和詮釋。通過這篇“Flash evolve Datacenter 閃存進化數據中心”沙龍觀點整理出來的文章,相信大家也對于數據中心十年發展中存儲的變化有了更為全面的了解,對于大家最為關注的閃存在SDS趨勢下扮演什么角色、企業需要什么樣的閃存的問題,相信大家也從文章中找到了想要的答案,而對于華為閃存整體策略Flash first:從1.0到3.0的細分,相信也給與各位網友耳目一新的感覺。