資料中心正在對快閃記憶體「狼吞虎咽」,但也有些「消化不良」的感覺以上是中國云端服務(wù)業(yè)者阿里巴巴(Alibaba)的資料中心部門首席技術(shù)專家 Wu Peng,在近日于美國加州舉行的快閃記憶體高峰會(Flash Memory Summit)上發(fā)表演說時分享的實(shí)際經(jīng)驗(yàn)。
Wu Peng表示,快閃記憶體供應(yīng)商最需要關(guān)注的是降低每GB成本,以及降低快閃記憶體的功耗與延遲,并提升可靠性;他指出,大多數(shù)快閃記憶體產(chǎn)品都會提供許多小時的故障間隔時間(mean time between failures,MTBF),以及多年保固:「但實(shí)際上我們遭遇不少性能規(guī)格表現(xiàn)低落的情況,因此我們正在尋找更穩(wěn)定、生命周期性能表現(xiàn)確實(shí)的產(chǎn)品。」
盡管面臨以上問題,快閃記憶體正在大舉進(jìn)軍資料中心;阿里巴巴在去年所采購的快閃記憶體量,就占據(jù)全球企業(yè)用快閃記憶體消耗量的至少1%,而且其使用量仍在成長中。阿里巴巴自五年前就開始研究快閃記憶體儲存方案,該公司現(xiàn)在除了采用全快閃記憶體資料中心,也在內(nèi)容傳遞網(wǎng)路(content distribution network)以及應(yīng)用程式伺服器中大量使用快閃記憶體。
去年阿里巴巴這家電子商務(wù)公司,創(chuàng)下了在24小時內(nèi)完成1.88億筆交易量,以及每秒1.5萬次交易的新高紀(jì)錄;為了穩(wěn)定跟上需求速度,應(yīng)用程式需要更多所仰賴的、關(guān)于快閃記憶體運(yùn)作情況的資訊。Wu Peng表示:「故障是無法避免的,但最好是要讓系統(tǒng)在硬體將發(fā)生故障時預(yù)先得知,以判斷何時發(fā)出警告以及何時必須將資料備份。」
阿里巴巴想藉由簡化硬體與軟體,以方便讓應(yīng)用程式得知底層快閃記憶體的狀態(tài);這家大型資料中心營運(yùn)商希望自己處理服務(wù)開通(provisioning)以及冗余(redundancy)問題,Wu Peng表示:「如果應(yīng)用程式能知道很多資訊,就能做很多事。」
在阿里巴巴近期遭遇的問題中,RAID控制器在與快閃記憶體共同使用時,糾錯(error correction)與電池備援會產(chǎn)生問題;同時Wu Peng表示,快閃記憶體供應(yīng)商太專注于提供更高速度的資料傳遞速率,卻太少關(guān)注降低延遲。
Wu Peng認(rèn)為快閃記憶體有五大問題需要改善
長期來看,Wu Peng認(rèn)為需要建立一個新的軟體編程模型,以因應(yīng)不斷變化的儲存層次結(jié)構(gòu)以及快閃記憶體的出現(xiàn);此外,供應(yīng)商導(dǎo)向(vendor-driven)的軟體定義儲存(software-defined storage)概念仍在「非常粗略的方向」,能讓資料中心滿足不同應(yīng)用的儲存需求。
而眾多新一代記憶體如STT-MRAM與相變化記憶體(phase-change memory)的崛起,也為資料中心帶來新的問題;Wu Peng表示:「有許多專利的事情被推給我們,但我們有困難去了解那些技術(shù)會失敗,以及何時是著手布署的正確時機(jī)?!?/p>
Wu Peng并邀請所有的供應(yīng)商擁有多樣化應(yīng)用程式的阿里巴巴實(shí)驗(yàn)室測試新產(chǎn)品:「我們有一個程序,測試可能最終會應(yīng)用在我們基礎(chǔ)建設(shè)上的新東西;測試過程確實(shí)會很漫長,但我們一直歡迎新產(chǎn)品?!?/p>