VMware的vSAN不僅給存儲設備供應商帶來諸多煩惱,同時也給用戶帶來很多需要認真考量的負面因素——在某些情況下,該方案甚至有可能導致數據消除。
不過同志們不必驚慌,容我再說幾句:目前vSAN尚處于測試階段,而且虛擬巨頭的技術工程師們正在努力解決這個問題。不過問題已然存在,VMware也已經在官方博客中詳細評述了此次事故。
文章中在不明顯的位置提到了此次數據丟失狀況,之前的內容則完全在討論在運行vSAN時RAID控制器的直通模式所帶來的優勢。下面我們摘錄了VMware官方的解釋,可以看到虛擬巨頭針對vSAN給出了頗為有趣的解讀:
“vSAN將磁盤作為持久性數據存儲機制,而閃存則充當位于磁盤之前的性能加速層——即讀取緩存與寫入緩沖區。所有寫入操作都將指向閃存層,而所有讀取操作也會優先選擇閃存層。這樣的設計能夠以最低的每GB使用成本(利用磁盤)以及最低的IOP成本(利用閃存)為用戶提供服務。盡管磁盤驅動器的單位GB成本較低,但其IOP表現則比較孱弱。
vSAN利用直通控制器直接管理著磁盤,這樣一來IOP相對較低的磁盤就能夠以經過優化的方式交付使用。為了實現這一目標,vSAN采用一種近端IO算法。這種近端IO算法被用于處理來自閃存設備的寫入操作,從而使寫入內容被保存在磁盤的相鄰位置。在這種設計的輔助下,“I/O混合”——也就是多套虛擬機系統在同時向同一塊磁盤執行I/O操作時,原本單一虛擬機中的連續性I/O將變成隨機I/O——將變得不再是問題。vSAN近端IO算法將隨機I/O從混合形式再次恢復成連續形式,從而改善性能表現。”
這一切看起來非常有趣,但大家最關心的一定還是文章開頭提到的“數據丟失”,對吧?不搞清這個問題,vSAN測試版很可能成為威脅存儲用戶的定時炸彈。
好消息是,數據丟失問題只會影響到使用高級主機控制器接口(簡稱AHCI)的用戶。根據VMware的聲明,AHCI“已經確定會給vSAN帶來問題”。
“二者共同運行會引發磁盤/控制器進入降級模式并導致PDL(即永遠性設備丟失),”VMware指出。“從而造成數據丟失并使vSAN變得不可用。”
這樣直白的表述對于VMware來說實在勇氣可嘉。
另一條好消息是,“vSAN技術團隊已經意識到這個問題”,這可能意味著虛擬巨頭已經開始與AHCI的出品方英特爾展開緊密磋商。需要強調的是,VMware產品與來自IBM、惠普、戴爾以及美光等多家RAID控制器廠商的方案都能良好協作,因此AHCI鬧出的事故并不代表vSAN測試版已經徹底淪為大家不應染指的垃圾堆。