眾所周知,NAND閃存的發展歷經了從SLC、MLC到TCL、QLC的四個階段。每個階段的發展,都伴隨著成本下降和容量及密度的上升,推動了閃存的進一步普及,但從性能和壽命角度,質疑也始終不絕于耳。
如今隨著第二代QLC的上市,戴爾也正式引入了QLC SSD,這背后究竟有哪些“考量”?今天就來談談引入QLC的原因。
毫無疑問,數字化正在改變整個世界,而數字世界的底層支撐,在今天已演變成為數量龐大且不斷產生、匯集、運算的非結構化數據。隨著企業數字化轉型的加速,數據已成為重要的新型生產要素,未來所有的場景都會以數據為驅動,而這些海量非結構化數據價值潛能的挖掘,則必須依賴強而有力的存儲系統。
在此背景之下,全閃存儲成為市場新的技術趨勢。根據IDC數據顯示,2021年中國全閃存儲實現26%的增長,占據19%的市場份額。其中,近36%的全閃存儲產品需求來自金融行業,同時制造、醫療、能源行業也在逐漸增加對全閃存儲產品的購買。尤其是隨著NVMe技術發展和SSD存儲介質價格的下降,更多的行業將會使用全閃存儲產品來構建或升級數據中心。
也正因此,戴爾科技集團日前宣布專為非結構化數據而生的PowerScale率先引入QLC SSD,希望能夠更好地助力行業客戶解決海量非結構化數據所面臨的實時分析等挑戰。此舉不僅能夠進一步降低企業部署全閃存儲的整體TCO成本,讓全閃存儲的落地和普及變得更加容易,由此釋放海量非結構化數據潛能,從而加速企業的數字化轉型,背后的價值和意義無疑深遠而重大。
引入QLC背后三重考量
事實上,作為數字經濟中的新型生產要素,數據在過去幾年時間里不但呈現出了爆發式的增長,其關鍵性更被提到了前所未有的位置。此前IDC也曾預測,到2025年產生的數據規模將達到180ZB,其中來自中國的數據有41ZB,而這一規模在2020年僅為全球64ZB、中國14ZB,而為了存儲和處理這些隨處產生的海量數據,存儲介質的變革也就變得至關重要。
可以看到,目前SSD的存儲密度和容量越來越大,同時NAND閃存也從之前的SLC、MLC逐漸轉向TLC和QLC,其中QLC于2018年誕生,在三年前正式規?;逃靡詠?,就受到了整個市場的高度關注。在戴爾科技集團大中華區存儲產品經理岑廣??磥?,PowerScale在這個時間節點引入QLC,也主要是出于以下三個方面的考量:
一、從市場的發展看,NAND 閃存歷經了SLC、MLC、TLC和QLC四個階段,而QLC是繼TLC后3D NAND的第四代存儲方式,也是當前最新一代的閃存技術。從原理上來說,QLC的每個單元可儲存4個數據(4bit/cell),也就意味著與前三種閃存相比,QLC閃存可以在同等的die面積上,存儲更多的數據,也就擁有了更高密度、更大容量、更低成本的優勢和特點。
因此,在企業級存儲市場中,QLC SSD的規?;慨a會帶來更低的價格和更高的性價比。使其更適用于AI計算、機器學習、實時分析等應用,從而進一步拓展全閃在更多要求時效的應用場景的廣泛使用。Gartner此前的預測中也認為,到2024年,產能升級中大約有超過1/4將會源自QLC SSD。
二、從應用需求看,目前包括金融、廣電媒體娛樂以及EDA設計等行業,由于日常要處理大量人工智能、機器學習以及海量的非結構化數據實時分析等業務,因此他們需要部署全閃存儲來化解這些挑戰,這也導致QLC SSD受到了市場的青睞。
“這些行業的一個重要特點就是性能要求高,同時存儲容量也比較大,過去都是采用很多節點使用許多HDD硬盤并發吞吐來搭建系統,但隨著全閃存儲的發展,尤其業界一些知名的閃存盤供應商提供了不少企業級的QLC SSD的產品和方案,這樣就讓QLC SSD應用到新興的工作負載中變為可能,同時更使得他們部署全閃存儲節點時也有了更多的選擇。”岑廣海說。
三、從技術趨勢看,無論是結構化數據,還是海量非結構化數據中,從混閃到全閃部署的轉變也是新的技術趨勢,而QLC SSD這樣的閃存介質能幫助這種轉變提速。
“
岑廣海:
“在非結構化數據領域,QLC SSD的引入會讓更多的行業用戶在構建數據湖的過程中從目前采用混閃節點過渡到全閃節點,這將是未來的一個重要發展。
背后的原因是,數據都是有不同的“熱度”,對應的存儲就可以采用分層的方式來實現金字塔式的數據生命周期管理。過去由于價格相對較高,很多用戶只能針對少量的熱數據采用全閃節點,而更多的溫數據和冷數據通常都是采用不同類型的HDD硬盤。而未來有了QLC SSD之后,分層數據湖的理念會更加被市場接納,更多的熱數據、溫數據可以用性價比很高的QLC SSD保存起來,從而更加有效地管理好企業的整個數據生命周期,并能更大程度、更高時效地挖掘這些數據潛藏的商業價值。”
由此可見,快速增長的非結構化數據量超乎人們的想象,而要化解這種挑戰,利用存儲介質帶來變化和優勢,無疑是一個重要的方向,而QLC SSD無論是從市場前景、應用需求還是技術發展趨勢來看,未來在全閃存儲部署中扮演更加關鍵和重要的角色,也將是大勢所趨。
PowerScale加持QLC
也正是洞察到這種變化,戴爾科技集團在其旗下的PowerScale中率先引入QLC SSD,其中PowerScale F600和F900這兩款支持NVMe的節點提供了15TB和30TB兩種QLC SSD的選擇。
特別是30TB的QLC SSD將提供PowerScale產品組合中密度最高的閃存。單個PowerScale F900節點就可支持高達736TB的原始容量或者900TB的有效容量(每個節點都開啟數據縮減的情況下),而整個存儲集群容量更提高至高達186PB,這將是以前最大容量的兩倍。由此可以更好地幫助行業客戶化解海量非結構化數據帶來的挑戰,具體來看:
首先,在性能方面。
我們知道,隨著存儲介質上每個單元存儲的數據不斷增多,盡管容量得到了提升,但市場上更多的關注點,還是其背后的性能和耐久性都會有所損失,但從TLC向QLC的切換過程中,PowerScale通過其存儲系統整體性能的優化,使得使用QLC SSD的節點的性能和使用TLC SSD的節點維持在了同一個水平。
岑廣海表示,性能對于行業客戶而言確實是非常關鍵的,但是,考察存儲的性能不能只局限于介質的性能表現,而應該從存儲的整體表現來進行衡量。從戴爾內部的測試結果來看,PowerScale使用同樣容量的QLC SSD的節點和使用TLC SSD的節點,其在性能方面的表現是一樣的。之所以有這樣的結果,是因為PowerScale在系統性能優化方面下了很多的“功夫”。
“PowerScale本身是一個橫向擴展,且通過多個節點和高速網絡連接組合而成的存儲集群系統,因此在實現讀寫功能時,或者說當有一個文件進來之后,PowerScale會把文件進行切片,然后分散給到所有的節點,讓節點自己去實現落盤——而背后代表的含義就是,數據不會只單獨寫到每一個節點之中,而是所有相關節點的多塊存儲介質分散地寫,這樣性能就得到了保障。
在此基礎上,PowerScale還有一個NVDIMM系統,也就是說它提供非易失性內存的能力,因此當數據寫入每個節點之中時,并不是直接落盤,而是先落在每個節點的NVDIMM里,等在NVDIMM中攢夠了一批再落盤。這樣無論是TLC或者QLC的SSD,對PowerScale而言幾乎都是沒有任何區別的,由此也最大化的利用了存儲介質性能,并保證了對整個存儲系統寫操作的性能發揮。”岑廣海說。
其次,在性價比方面。
在性能和TLC SSD保持相同的情況下,QLC SSD最大的優勢體現在,它每TB的價格會比現在降低20%。和傳統的存儲銷售方式不一樣,PowerScale是按照節點來銷售的,因此存儲介質成本的降低,就會帶來同等容量規格的節點構成的存儲集群成本的降低,或者同等容量的集群因采用更高密度的節點而帶來成本的降低。這些都能整體上降低企業的TCO成本。
最后,在大容量全閃存儲系統方面。
高性價比的QLC SSD的引入也會推動大容量全閃存儲系統的落地和普及。
可以簡單計算一下,以PowerScale F600為例,其支持最低3個節點起步,那么當采用15TB的QLC SSD之后,整個存儲系統最低支持的容量就是360TB的裸容量;而PowerScale F900,如果采用30TB的QLC SSD,最小配置也是3個節點,這個最小配置的存儲系統支持的容量卻可以高達2160TB的裸容量,相當于提供了2個PB的容量。而上面的這些最小配置,后續都可以根據業務需要,按需靈活地一個一個節點地增加,從而線性地擴展系統容量和性能。因此無論是對于何種規模的企業,能夠提供非常靈活的高密度大容量的全閃系統,同時也能夠節約更多的空間和能耗。
更為關鍵的是,PowerScale由于是橫向擴展系統,未來企業也可以在整個存儲系統中,隨著數據的增加不斷擴充新的節點,或者加入其他更低成本的節點來保存冷數據。這樣在同一個系統中就能實現分層數據湖的整個生命周期管理。這不僅是最科學的按數據價值來進行的存儲投資,同時,也能大幅簡化企業非結構化數據的管理,因為同一集群的分層數據可以根據規則在集群內自由智能流動,而無需人工干預。
釋放非結構化數據潛能
當然,也要看到盡管QLC技術落地已經過去了幾年時間,針對QLC技術的生態系統也在不斷完善,但市場上對QLC技術依然有些“擔憂”或者誤解,主要集中在兩個方面,即性能和壽命。
針對性能,上文已經有所涉及,對于基于QLC的SSD產品,目前SSD的供應商其實也正在通過多種技術對性能進行補償,比如多通道,多die,利用高并發對性能進行補償等;而PowerScale本身也在存儲系統整體的性能優化方面進行創新,使得QLC的性能表現了取得了和TLC一樣的成績。
針對壽命,有 數 據 顯 示:從 SLC-MLC-TLC-QLC, 其可擦寫的次數 P/E(一次完整 NAND 全盤寫入)從10萬次、30000-1萬次、300—1000 次、100—150次一路走低,也就是說其耐久度和壽命確實是顯著了下降了。對此,岑廣海強調說,如果從技術的角度出發來看,QLC介質的使用壽命完全不是一個值得擔心的問題,因為可以從幾個維度來做觀察:
◆第一,衡量SSD的使用壽命涉及幾個指標:PBW、P/E和DWPD。這三者的關系是DWPD = (PBW/CAPACITY/WARRENTY_PERIOD/365)=([P/E]/WARRENTY_PERIOD/365)。從DWPD指標維度看,所謂DWPD指的是每天的寫入次數,目前戴爾科技集團使用的是企業級的QLC SSD,其DWPD的數據是0.42到1.7之間(取決于寫操作的模式),那么對于一個企業而言,每天是否有可能對搭載了QLC介質的存儲系統寫入0.42次呢?
“我們以PowerScale F900最小配置3個節點來測算,如果都配置15TB的QLC SSD,大約能夠提供1080TB的裸容量,也就是1個PB多一些,為了簡單地示例,我們就拿裸容量來進行估算。在如此之高的容量之下,假設企業每天改動其中10%的數據,那就是100TB左右的數據,但在實際具體的應用中,很少有企業會每天都改動100TB的數據??墒俏覀冇眠@1PB的容量乘以0.42的DWPD指標,卻可以得到整個存儲系統每天允許420TB的數據量被改動,這遠大于剛剛計算得到的100TB的改動量。
所以即使企業真的每天要寫入100TB的數據,那么QLC SSD也是能夠完全支持的。同時讀操作對QLC的使用壽命是完全沒有影響的。而實際上,企業大部分應用并不是只有純粹的寫操作,而是混合的讀寫操作,甚至,大部分的應用屬于讀多寫少。因此,我們不能僅僅只看到QLC 0.42的DWPD指標,就簡單地下結論說QLC使用壽命短不適用于企業存儲,而要具體分析企業實際使用場景,從而來打消客戶在網絡上閱讀到的QLC使用壽命不行的簡單印象。”岑廣海說。
確實如此,如果我們繼續分析的話,不僅是企業很少每天改動超過100TB的數據量,同時對企業來說因為數據本身也會做數據分層,有熱數據,也有溫數據和冷數據,那么在熱數據當中它的熱度會保持多長時間呢,是一天,一周還是一年等等,那么當這些數據從熱數據變成冷數據之后,還會繼續每天去做讀寫操作嗎?因此,對于QLC SSD盤來說,目前實際上是沒有足夠的數據,將全盤寫滿100次,且寫滿100次也需要很長的時間,可以說QLC SSD盤被“寫穿”的現象其實僅存在理論的層面,在具體的企業應用中是難以發生的。
上面的計算是基于QLC SSD保存了所有熱度的數據進行的分析。如果有客戶強調說,采用QLC的節點保存的都是熱數據,而溫、冷的數據會遷移到其他采用HDD的節點,這樣就會使得QLC節點的寫壽命變得非常聚焦而突出。針對這個問題,我們可以這樣來思考:最低配置的QLC節點池是F600配置15TB的QLC SSD,那么最少也是擁有360TB裸容量的空間。即使按0.42的DWPD(100%寫操作)來計算,那么又有多少客戶擁有持續每天寫入遠超150TB的數據的需求呢?
◆第二,從QLC介質維度來看,針對 QLC NAND 顆粒的壽命和耐久度,這次PowerScale采用的是第二代企業級的QLC SSD,來自Solidigm(也就是原來的英特爾的全閃驅動器)。Solidigm所使用的垂直浮柵閃存采用了更高端的氧化層進行控制,大大降低了電子干擾的風險,同時將電子數量提升了6倍左右等等,再如Solidigm在QLC SSD盤固件設計上,也有磨損均衡設計,盡可能將數據均勻散步在各個顆粒,避免局部熱點的出現等等,換句話說QLC SSD供應商方面,本身也在一直提高QLC介質的壽命。
◆第三,從PowerScale的維度看,PowerScale同樣針對QLC SSD提供了三重的“保障”,包括PowerScale的體系架構設計和讀寫機制上,能夠有效的延長SSD盤的使用壽命,具體的原理在上文中已經分析過;同時,PowerScale針對QLC SSD也提供了對應的維保服務,一旦QLC SSD出現問題,在有效維保期內,同樣能夠免費更換的。
“
岑廣海:
“我們之所以如此強調QLC的壽命問題,主要是很多客戶對QLC的壽命問題有很多的疑慮,但其實QLC使用壽命的問題是不用擔心的,因為無論是介質的供應商,還是戴爾科技集團已經在多個方面提供保障,希望能夠進一步打消客戶的擔憂。目前,從戴爾全球客戶的應用情況來看,不少行業客戶已經成為了首批‘吃螃蟹’的客戶,而在中國市場,我們也致力于通過PowerScale提供QLC SSD選擇,推動大容量高密度的全閃存儲系統的進一步落地和普及,幫助更多行業客戶更好的應對非結構化數據的挑戰。”
總的來說,全閃存儲系統過去幾年之所以保持了高速的發展,關鍵就是大量新技術的引入,如基于NVMe的全閃存陣列能夠進一步減少存儲時延;而QLC SSD的引入,則是能夠顯著提高存儲容量的同時,更有助于企業進一步降低TCO成本。從這個角度來看,本次PowerScale率先引入QLC SSD,其實在整個存儲市場中也起到了“風向標”的價值和“示范效應”,不僅能夠推動非結構化數據的全閃存儲的落地和普及提速,也能夠幫助企業實現數字化轉型的加速,并最大化的釋放海量非結構化數據的潛能。
如果您想了解更多有關戴爾科技的產品和解決方案信息,請掃描以下二維碼咨詢戴爾官方客服。