固態驅動器(SSD)是否能夠讓大數據分析變得更有效率?
Phil Goodwin:首先,我來描述一下三種不同類型的SSD部署。第一種是服務器端高速緩存,即直接將SSD安裝至服務器;第二種是存儲端高速緩存,我將其形容成“Tier 0”,即通過自動存儲分層將SSD置于陣列中的一個特定層;最后一種是全閃存陣列。
好了,現在我來回答剛才的問題,“SSD能否讓大數據分析變得更為高效”,我的答案是“不能”,不過也不能一概而論,其取決于你的環境是CPU受限還是I/O受限。分析講究兩個重要的因素:處理和I/O。如果是CPU受限,或是處理端負載過重,那就沒辦法,事實上你需要換個更快的處理器;但如果你需要循環往復地讀取大量的數據(其中也摻入大量需要順序讀的數據),或者類似的情況,這就是I/O受限,那么SSD的確能夠幫上忙,讓大數據分析變得更有效率。
因此,確切地說,問題應該是:當處于I/O受限的環境時,哪種SSD部署更為明智?實踐表明,當處于需要翻來覆去地讀數據的情況時,使用服務器端或Tier 0;而當讀取的數據是大量且連續的(而不是循環式的),布置全閃存陣列則更為適合,可以從中獲得大量的性能。自此,你就可以從正確的配置中真正地收獲奇效。