當(dāng)企業(yè)客戶投資諸如全閃存陣列等存儲技術(shù),無論是采用Violin Memory公司或是Pure Storage公司等閃存提供商的產(chǎn)品,他們所期望的是能夠在運算速度方面帶來迅速而明顯的提升,以證明他們的投資是值得的。
大多數(shù)最新存儲技術(shù)的設(shè)計均能夠提供在性能方面的明顯改善。例如,更快的驅(qū)動或更大的緩存,但是,這并不總是發(fā)生。
當(dāng)與客戶討論SAN故障排除時,我們經(jīng)常發(fā)現(xiàn)那些最意想不到的狀況往往發(fā)生在部署了新技術(shù)之后,并且總是由虛擬或物理主機通過存儲基礎(chǔ)設(shè)施上的不同點的錯誤配置所引起的。
由于這個原因,那些在更快的存儲方面下血本投資的企業(yè)客戶卻最終發(fā)現(xiàn)他們的應(yīng)用程序性能并沒有得到很好的改善。
當(dāng)我們查看到底是什么原因?qū)е聭?yīng)用程序的性能表現(xiàn)不佳時,可以從如下幾個較為固定的方面進行排查。這些措施包括:
存儲陣列配置
例如,我們經(jīng)常會發(fā)現(xiàn)一個面向客戶的數(shù)據(jù)庫或其他應(yīng)用程序遠比我們所預(yù)期的更受歡迎。一款新的面向客戶的應(yīng)用程序最初預(yù)計只有6萬名用戶,結(jié)果其用戶數(shù)量突破了300萬,這無疑大大超出了存儲、網(wǎng)絡(luò)和主機的負荷能力。
這種情況通常是這樣造成的:最初的設(shè)計是足夠的,在彼時的情況下,其架構(gòu)是能夠承受最初設(shè)計的相關(guān)需求的。但是,一旦應(yīng)用程序是在陣列負載之下,其本身并不總是足夠能處理的。另外,事情總是變化的,期待一個存儲陣列能夠在未來長達三至五年的時間內(nèi)滿足所有的工作負載需求也是太過樂觀了。
因此,衡量組成I/O棧的組件成為了關(guān)鍵,這需要在正確的粒度級別。我們經(jīng)常看到測量比毫秒更長的時間間隔,這就正是您所需要查看的I/O性能。
如果您不針對每個I / O都進行實時的查看,某些問題可能無法引起足夠的重視。從實時數(shù)據(jù)中查詢歷史數(shù)據(jù)是一種常見的錯誤。同時,大多數(shù)陣列供應(yīng)商只保留數(shù)據(jù)24小時,所以在問題發(fā)生之前,可能無法對其進行識別,并發(fā)現(xiàn)其趨勢。
交換機問題
當(dāng)我們進入到堆棧的第二部分:光纖通道交換機時,經(jīng)常發(fā)生交換機的性能與供應(yīng)商沒有太大關(guān)系的問題。博科和思科的SAN交換機產(chǎn)品非常棒,就像陣列一樣,其在堆棧中只是一個設(shè)備。
有些人認為他們可以得到除了SAN交換機之外,所有他們需要的性能信息。但不幸的是,事實并非如此。這就像我知道高速公路非常繁忙塞車(類似于吞吐量),但我還是不一定能預(yù)料到我多久能回家(類似于延遲性)。而我家人關(guān)心的又是什么呢?我何時能到家。