對于各種情況下處理硬盤我們已經有50年的經驗積累,范圍從筆記本到大型陣列。SSD,雖然不算什么,但是我們確實還有很多需要去學。
盡管花費數十億的美元用于備份電源和發電機,但是數據中心的電源故障并不少見。鑒于專用的閃存轉換層(FTL)的原因,目前還沒有簡單的方法能夠不經過測試就可以了解SSD的行為。
在了解了固態硬盤的魯棒性電源故障后,俄亥俄州立大學的研究員Mai Zheng 和Feng Qin以及惠普實驗室的研究人員Mark Lillibridge和Joseph Tucek,在研究電源故障時如何影響基于閃存的SSD的運行狀況時,得到的答案是:并不是很理想。
研究
研究小組開發了檢測電源故障的硬件,檢查設備故障后一致性的軟件。它們可用來檢測15種不同的SSD和兩種硬盤。
筆者看了幾種類型的錯誤,包括字位損壞、斷寫、主數據損壞和“死”設備。寫數據用于配置檢測這些和其他的錯誤。
這里有三種工作負載形式——并發隨機寫入、并發連續寫入、單線程連續寫入,這三種最大限度的完成SSD內部負載。SSD有幾個后臺運行任務,例如垃圾收集,運行持續性以保證SSD就緒和組織。
測試SSD
15個不同的SSD,其中10個不同的型號來自5個不同的供應商,都已經測試了。價格范圍從每GB 63美分到6.5美元不等,使用MLC和SLC閃存。另外兩個硬盤驅動器,一個低端和一個高端的,也經過測試了。
結果
好消息是:其中有6個預測到的故障,有5個是可以觀察到的;其中兩個設備的運行狀況跟預期一樣。壞消息是:有13個設備出現故障問題。
每一個出故障的設備丟失了大量的數據或者在電源故障的情況下損壞了大量數據。
三個設備的字位有故障;三個有斷寫問題;八個有序列化錯誤;一個設備丟失了三分之一的數據。低端硬盤驅動器有一些非序列化寫入問題,然而高端驅動器沒有出現電源故障問題。
這兩個SSD沒有出現故障碼?兩個都是MLC 2012款中端產品,每GB的售價是1.17美元。
因為這需要無間斷操作,所以存儲是IT基礎架構中最難的部分。這有無數種可能使得數據受到干擾。
SSD還是很新的技術,還有很多特性可以被重新設計。我們還有五年的時間可以讓未來企業中都使用SSD,就像今天都是用硬盤一樣。
家庭和小型辦公室的SSD用戶在關鍵服務器和臺式機上裝有備用電池是很明智的。當然,筆記本已經有備用電池了。