SSD的出現給數據存儲領域帶來了革命,然而我們對其實際工作方式卻可謂知之甚少。如今,Facebook公司與卡耐基-梅隆大學的研究人員們一同發布了其經過長達數百萬小時工作后整理出的結論。
每一天,存儲業界售了的SSD產品總量高達數百萬塊,而其給人留下的最大印象就是能夠顯著加快系統引導與應用啟動速度。不過其對于全天候不停轉的數據中心來說意味著什么?管理員們又需要留心SSD所帶來的哪些常見問題?
考慮到上述疑問,卡耐基-梅隆大學的Justin Meza及OnurNutlu與Facebook公司的Qiang Wu及Sanjeev Kumar共同開展了一項“閃存記憶體現場故障狀況大型研究”,旨在了解SSD在日常運作中的實際表現。
基本方法
Facebook公司可算是SSD方案的早期擁護者了。他們多年以來一直是Fusion-io公司——PCIe SSD產品的先驅性開發廠商——的最大客戶,因此他們擁有著更為深層的SSD使用經驗:每天數百萬塊驅動器保證其具備充足的考察對象。
遺憾的是,這項研究并沒能針對多家供應商分別實施。相反,此次調查只能根據部署時間對SSD加以考察,這意味著部署時間最長的SSD屬于第一代設備,而時間較短的則為第二代設備。
更重要的是,該研究團隊對于故障作出了自己的定義,即由不可糾正的讀取錯誤(簡稱URE)所導致的數據丟失。這類故障狀況并不意味著SSD設備已經徹底損壞,但是那些曾經出現過一次URE狀況的SSD往往很容易再次遭遇同樣的問題。
與個人用戶不同,Facebook公司更傾向于使用容量最大的企業級SSD產品:其最新一代方案容量可達3.2 TB。這些可絕不是那些常見于筆記本設備之上的每GB要價35美分的SATA固態硬盤。相反,它們屬于經過極限配置的PCIe SSD,在設計思路方面專門考慮到了高負載循環的需要。
除此之外,由于SSD無需依靠控制器糾正內部讀取錯誤,因此本次研究當中所發現的錯誤只包含那些被報告至服務器的狀況。服務器有時候能夠重構SSD控制器所無法處理的數據,因此我們可以將其視為設備層級的報告、而非介質層級。
研究結果
好消息是,某些人們所擔心的問題其實完全并沒那么夸張。壞消息是,我們忽略掉的問題往往時有出現。
溫度
SSD對于工作環境的溫度非常敏感——比普通磁盤驅動器更加敏感。當溫度過高時,SSD的性能往往會有所縮水。因此,如果某些服務器莫名其妙地出現性能下滑,請各位管理員檢查溫度這一指標。
第一代SSD產品往往會在溫度上升時發生故障率增加的情況,這可能是因為其缺乏對應的抑制機制所導致。部分第二代SSD則能夠在高溫環境下顯著降低故障發生機率——當然,也有一部分第二代SSD的故障率與上代方案基本一致。
總線供電
SSD顯然是一只電老虎。PCIe v2 SSD的正常運行功率一般在8瓦到14.5瓦之間,如此巨大的浮動區間以及高額功耗可能遠超大家的想象。研究團隊發現,當功耗水平提升時,SSD設備的故障率也會隨之增高。
寫入疲勞
該研究團隊發現,系統級別的寫入活動與SSD故障緊密相關,這很可能是因為閃存寫入操作需要消耗大量電能。因此對于像日志系統這樣會帶來高強度寫入操作的應用程序來說,普通磁盤可能會是更好的選擇。
SSD故障
SSD故障——也就是前面提到過的URE——相對比較常見:報告不可糾正錯誤的SSD占比由4.2%到34.1%不等。事實上,上一周曾經報告過錯誤的SSD當中,有99.8%會在下一周再次報告錯誤。
生命周期與故障
SSD故障表現與磁盤驅動器不同,后者的開箱故障率較高,但接下來幾年的可靠性則比較理想,并最終隨著時間的推移再度呈現出高故障率態勢。SSD的早期URE狀況往往是由于某些存儲單元被識別為存在故障,其余正常產品擁有良好可靠性,直到隨時間推移由于存儲單元損耗而導致故障機率增長。
數據布局
磁盤驅動器的運作效果并不會受到數據布局的顯著影響——除非其中涉及大量隨機搜索操作。不過SSD的情況則完全不同。
稀疏的邏輯數據布局——也就是非連續數據——會導致較高的SSD故障率,當然數據密度過高亦會產生同樣的效果。
存儲空間占用
這部分內容在此次研究團隊的論文當中占有重要比重。我們都知道SSD在空間占用方面與磁盤驅動器存在明顯差異——也就是固態與機械間的區別——但具體差異如何卻不可預測。
PC SSD往往呈現出較高的錯誤率,但用戶——包括我個人在內——卻往往注意不到。而且一旦出現數據問題——就像我上周在MacBook Air的500 GB SSD當中所遇到的——我們根本不知道問題為何產生。是SSD的毛病?HFS+文件系統的問題?惡意軟件?還是宇宙射線的干擾?答案很難確定。
如果大家管理著配備有SSD的服務器,那么不妨從以上方面入手進行一番探尋。此次聯合研究團隊以循證醫學的角度對SSD特性作出了調查,并提供了獨一無二的SSD實證結論。
如果大家在使用SSD的過程中有所發現或者遇到了莫名其妙的狀況,也請在評論欄當中分享您的經歷與心得。