存儲極客
這是一群存儲偏執狂
為存儲而生,跟存儲死磕
各具獨家秘笈
有觀點,有碰撞,有干貨
從8月18起
做客存儲極客欄目
與你分享存儲里的那點事兒
前不久,全球閃存峰會(Flash Memory Summit,以下簡稱FMS)的技術委員會主席Brian Berg在北京演講時表示,“摩爾定律是一個非常偉大的定律,但是在閃存市場,現在看來閃存技術的發展是可以超過摩爾定律的。”
什么?沒聽錯吧?戈登·摩爾那個偉大的摩爾定律,那個縱貫微處理器乃至整個半導體行業技術發展的摩爾定律,會在閃存技術的發展中,失效?但是顯然,當著會議現場1000多位聽眾,Brian Berg身為全球最大閃存、內存方面會議的技術主席,不會是信口開河,那么,問題顯然就轉變為了,“為什么閃存技術的發展會超過摩爾定律?”
首先,讓我們先回顧一下摩爾定律:在價格不變的前提下,集成電路芯片上所集成的電路的數目,每隔18個月就翻一番。在過去的五十年(摩爾定律是1965年提出的),摩爾定律一直發揮著效用,但是在最近幾年,隨著制程工藝的進步變得越來越難,認為英特爾等處理器供應商無法繼續延續摩爾定律發展的觀點甚囂塵上。但在閃存技術上,卻截然相反,持Brian Berg同樣觀點的人認為:“閃存技術的發展正在打破摩爾定律,這種打破,是超越而不是無法遵從。”
但為什么閃存技術會出現超越摩爾定律的情況呢?眾所周知,閃存同樣是一種半導體技術,其整體容量和性能發展,應當充分遵從摩爾定律,特別是閃存技術(比如NAND Flash)的制程工藝步進與處理器是類似的:
NAND閃存制程還不是很突出
2014年市場上的主流制程技術是三星和東芝的19nm以及SK海力士和英特爾/美光的20nm;2015年,市場正逐步過渡到15nm和16nm技術;到2016年第四季度,除東芝將提供13nm左右的制程工藝之外,三星、SK海力士、英特爾/美光將會把支撐維持在14nm制程級別——事實上,英特爾的14nm制程處理器上市已經有很長一段時間了,閃存技術到2016年如果采用14nm制程的話,要比英特爾的微處理器晚了接近3年的時間。
但事實卻是,閃存技術的發展,特別是企業級產品的普及速度確實超乎想象的快:如今在不考慮壓縮或重復數據刪除技術的前提下,以戴爾為例,其全閃存陣列的每GB裸容量已經能夠降低到1.5-1.6美元這個區間,也就是說,大約一年的時間,企業級全閃存陣列的價格最多降低了60-70%。
另一方面,我們來看企業級SSD,同樣是一年前,業界主流產品的最大容量是3.84TB,現在這一數字是6.4TB,也就是大約提高了一倍,而單盤價格實際上還略微下降;而據三星在今年8月份在FMS上展示的路線圖顯示,最早今年年底,最遲明年上半年,三星將可以在2.5英寸封裝中提供約16TB的容量(15.36TB)。
閃存容量的提高顯然是和NAND Flash的單位容量及密度有關的,單顆NAND Flash芯片的容量越高,或者說單位面積上的NAND Flash的容量密度越高,SSD的容量(以2.5英寸封裝的SAS、SATA或SFF-8639盤為標準)也就越高。
3D TLC NAND Flash:這么多前綴,怎么解釋?
在閃存技術最開始興起的那幾年,我們最常見到的閃存是SLC和MLC,前者即Single-Level Cell,每NAND Flash Cell上都存儲1bit的數據,壽命、性能最好,但也更貴,后者即Multi-Level Cell,即2bit/cell,壽命和性能相比SLC有所下降,但成本大約只是SLC的30%左右。
所謂3D TLC NAND Flash中的TLC,與SLC、MLC所描述的對象是相同的,即Trinary-Level Cell,即3bit/cell,在一個Cell上做到存儲3bit的數據是一件相對比較難的事情,成本只是每單元2bit的MLC閃存的約三分之二,速度和壽命表現雖然相比MLC有所下降,但相對傳統HDD而言,仍然是天壤之別。
但為什么TLC要比MLC更難實現呢?這就要說下NAND Flash的“存儲機制”,或者說是“如何存儲數據”:眾所周知,計算機存儲的數據是二進制,也就是1和0,在半導體上,這實際上可以簡單地理解為“有電”“沒電”或是“電壓高”“電壓低”,也就是只要有可以通過電位表達“非黑即白”就可以了。
所以,對NAND Flash寫入1,就是控制Control Gate去充電,使得存儲的電荷夠多,超過閾值Vth,就表示1了,而對于寫入0,就是將其放電,電荷減少到小于Vth,就表示0了——在MLC中,其實現機制就是,通過控制內部電荷 的多少,分成多個閾值,從而儲存為不同的數據。
試想,在2bit/Cell的MLC中要分為幾個閾值?要是3bit/Cell呢?事實上,理論上簡單的事情,在實際中就顯得比較麻煩了:相比SLC來說,MLC已經需要控制4個狀態,即00、01、10、11,TLC就需要控制多達8個狀態,顯然這是一個非常困難的事情,每Cell的bit數量越多,閾值越多、狀態越多,更為重要的是,閾值之間的電壓差也就越小(總不能內部搞個幾萬伏高壓吧……),出錯的概率自然也就越高。
需要補充的是,業界還是有一些“瘋子”是不相信自己做不到任何事情的,某些供應商正在考慮4bit的NAND Flash,從來自NAND Flash生產設備供應商的消息顯示,東芝很可能是4bit技術的主要推動者,但就東芝方面的消息表示,“這個東西基本上做出來,很難。”
接下來就要說到3D TLC NAND Flash中的3D,這就涉及到NAND Flash的Die的設計,而在此之前,我們要對NAND Flash的幾個主要名詞做個解釋。
在NAND Flash中,每一個“芯片”分為Die、Plane、Block和Page,這里所說的芯片,即每一個封裝好的Chip,Die則是晶圓上的小方塊,在一個NAND Flash芯片中,可以封裝多個Die,無論工藝、技術有如何不同,Die的概念都是基本相同的。
Plane則是NAND Flash能夠根據讀、寫、擦除等命令進行操作的最小單位,一個Plane里面以矩陣的形式包含了若干個Block,這是NAND Flash的最小擦除單位,其中包含了若干個Page,這是NAND Flash的最小讀寫單位(其中包含若干個Byte)。
說回到“3D”,為什么叫3D呢?這是因為過去NAND Flash主要是以2D的形式,也就是在平面上排列NAND Flash Cell(存儲單元),但三星、東芝等公司后來發現,完全可以采用多層堆疊的方式,于是也就出現了32層乃至48層堆疊的NAND Flash。以三星采用的3D Charge Trap Flash(簡稱CTF)結構設計的3D TLC V-NAND Flash為例,其精密程度已經邁入到每顆芯片包含853億個Cell,以3bit/Cell來計算,一共能存儲約2560億bit數據。也就是說,在一個指尖大小的NAND Flash芯片上,可以存儲256Gb的數據,而晶圓密度是上一代產品的1.4倍。
東芝NAND Flash業務高層Shigeo Ohshima曾透露,NAND Flash的容量會有“持續的、爆發式的、翻倍的增長”,他認為,2016年,體積不變的情況下(2.5英寸封裝)容量可以達到32TB,2017年是64TB,2018年是128TB(歷史同期來看,傳統HDD的容量增長預測是到2020年20-40TB)。
相比東芝計劃開戰4bit/Cell的NAND Flash,三星則熱衷于“堆積木”,這家公司對當前的32層、48層NAND Flash都不太滿意,放言“2、3年內會出現100層以上堆疊的NAND Flash”,不知道到時候東芝心情如何?
說了這么多美麗的遠景,看起來NAND Flash市場是光明一片,至少對三星、美光、SK海力士、東芝等供應商來說,摩爾定律基本上不夠這些公司通過3bit、4bit、32層、48層等技術來進行追趕的了,但摩爾定律的關鍵在于:既然是“在價格不變的前提下”。那么技術先進了這么多,密度提高了這么多,成本也自然會下降這么多,那什么時候NAND Flash會出現大規模的降價呢?
熬著不降價?等到2016年再看!
3、4年前,市場上對NAND Flash的降價可謂是“一往情深”,NAND Flash供應商也好,企業級存儲系統的供應商也罷,媒體、分析機構、渠道,都認為“NAND Flash會馬上進入快速價格下降通道”,從而快速的取代傳統HDD在高端、高性能存儲介質層的位置。
換句話說,市場非常相信摩爾定律的“魔力”在NAND Flash市場上也能夠發揮如同處理器一樣的功效,快速取代過去近三十年發展速度遠遠追趕不上處理器、內存的傳統HDD存儲介質,可惜,市場告訴我們:真相永遠只有一個,并且這一個永遠都是最殘酷的那個。
根據市場調查機構的數據,2009年至2014年,NAND Flash市場的每GB價格年均跌幅,只有2009年、2011年和2012年超過了30%,在2010年、2013年和2014年,每GB成本下降都只有15%、18%和27%;在2015年至2016年,這一數字實際上預期也只是維持在25%-30%的水平上,這一降幅,離摩爾定律所說的“每18個月翻(降)一番”,可是遠得很!
事實上,這也就是為什么過去3-4年,NAND Flash的出貨量一直維持在年均增長40-50%這樣一個水平線上的主要原因,那么,為什么價格一直遲遲不能真的遵守摩爾定律呢?
這里面的原因非常多也非常復雜,但總的來說,核心原因有兩個:第一,在東芝、三星、SK海力士之間的競爭中,幾乎所有的NAND Flash供應商都被卷在了這個漩渦中,制程工藝從20nm、16nm到14nm快速推進,1bit、2bit、3bit的介質不斷更新,32層、48層的堆疊快速成型,這些技術上的進步都影響著這些NAND Flash供應商的生產線升級、產品設計生產、供貨產業鏈以及市場推廣和渠道費用,有一位三星的內部人士曾經這樣認為:“原本3年內要拿出來的產品,被壓縮到2年,再壓縮到18個月,相當于用兩代產品的成本去獲取1代產品的收入”,所以在如此巨大的成本壓力之下,NAND Flash供應商要承受的壓力可想而知。
第二個原因和前一個息息相關,那就是NAND Flash供應商希望能夠在閃存市場上持續獲得“與性能提升成正比的利潤率提升”,就像三星將傳統HDD業務出售之后,他們不僅希望高利潤能夠緩解產品迭代所造成的成本壓力,更希望能夠從NAND Flash和傳統HDD之間巨大的性能差距上獲得高額利潤,這也是NAND Flash供應商遲遲不愿意降價的主要原因。
從上述的原因說明來看,阻礙NAND Flash價格下降的原因,主要是出在NAND Flash供應商本身,這意味著降價空間實際上是比較大的,根據市場分析機構的預計,各大NAND Flash供應商的成本承受能力,大約在2016年上半年會基本上被充分釋放,也就是說,2016年下半年,NAND Flash會迎來一波比較大的價格下降,預計2016年全年的NAND Flash價格下滑能夠超過40%,逼近50%。
提前釋放降價空間,須保證性能和可靠性
通過率先引入企業級TLC 3D NAND SSD,戴爾能夠提供更具價格競爭力的全閃存陣列,并在維護期內無條件更換故障SSD(不計數據寫入量/磨損程度)。這種承諾在顯示出技術信心的同時,也讓用戶更加放心。
不過,對企業級存儲系統的用戶來說,大可不必等到2016年,前面我們說過,戴爾已經將全閃存陣列的價格推進到每GB物理容量1.66美元(僅供參考,與具體配置有關)。需要指出的一點是,某些存儲系統供應商雖然也通過數據縮減技術給出了更好看的數字,但其中一些會影響到性能。而戴爾SC陣列還支持增強型壓縮,其最大特點是通過與備受好評的自動分層存儲巧妙結合,其壓縮動作成為定期執行的后臺任務,從而有效避免了對寫入性能的影響。同時,在不額外添加專用硬件的情況下,高效壓縮算法保證了讀性能不下降。
3D NAND在一定程度上改善了TLC的寫入壽命,而戴爾SC還能通過獨特的自動分層存儲技術,在讀密集型閃存和寫密集型閃存之間做讀/寫分離,進一步保障經濟型企業級閃存的可靠性。只需要加入一個高寫入耐久度的SLC/eMLC SSD分層承擔所有寫入負載,既保障了性能,又使隨機/重復的數據IO能夠合并優化地導入至TLC SSD,達到了“少花錢,多辦事”的目的。
上圖來自本月在美國舉行的閃存峰會上一場戴爾的演講《Redefining the Economics of Enterprise Storage》。根據其中的統計數據,在20多個月的服務監測周期內,Tier 2分層中66%的SSD驅動器只有不到0.1 DWPD的寫入壓力。進一步的說明包括:
1.所有進來的寫入被引導至Tier 1,數據只是按需移動;(注:取決于用戶實際寫入量和Replay快照設置的周期)
2.Tier 2 SSD的規格是每天1次完整寫入(1 DWPD);
3.在服務期內,沒有驅動器的年平均寫入量超過1 DWPD。
從某些方面來說,企業級存儲系統的供應商為了搶占市場,從2014年底至今,開展了一輪又一輪的“降價”活動,通過其自身與NAND Flash供應商巨大的議價能力、新技術的快速采用以及軟件管理控制能力,提供了比NAND Flash價格下降幅度更大的降價空間。換句話說,2016年下半年的NAND Flash降幅,早就在2015年被企業級存儲系統供應商們提前釋放了。