近日,在日本東京舉行的Interop展會上,經過行業專家和頂尖學者多輪嚴格評審,華為新一代OceanStor存儲Dorado系列,憑借“具有壓倒性的性能和穩定的極低時延,支持通過AI芯片對I/O處理進行自我優化。”一舉奪得Interop Tokyo 2020 Best of show Award 金獎。這也是繼2017年上一代OceanStor存儲Dorado系列獲獎后,再次獲此殊榮。
“這是業界首款將AI模塊應用在存儲里的產品”評審團的一位專家說道,“憑借這款內置在存儲里的AI插件,OceanStor存儲Dorado系列能夠實時智能地分析工作負載,不斷優化緩存預取算法,提高讀取命中率,并且隨著時間的推移,系統性能提高20%。”
華為率先將AI能力內置于存儲系統,這項創新獲得了Interop 專家評審團的一致認可。這背后是華為研發團隊堅持不懈的努力。接下來,我們就讓華為OceanStor存儲Dorado系列產品首席架構師張鵬,來為大家揭秘首款內置AI模塊的存儲背后的故事。
高端存儲產品由于追求極致的可靠性,所以看似固執守舊,其實卻蘊含新生機。人工智能技術的崛起,賦予了高端存儲新的生機。
“要讓一個存在幾十年歷史的產品煥發活力,必須思考加入一些創新性的技術。”張鵬如是說。為此,華為在OceanStor 存儲Dorado系列中加入了大量的智能技術,“華為在AI算法方面投入很大。”比如,采用 AI模塊基于機器學習框架,主動分析并掌握多個應用模型的IO規律,讓讀緩存命中率持續提升。
“OceanStor存儲Dorado系列這種全互聯、全共享的架構,非常適合采用機器學習這些人工智能技術,對IO進行全局的學習和分析,實現存儲操作更加智能化,從而提升系統的性能和效率。”張鵬補充道。
內置智能AI模塊,學習IO規律,優化預取算法,提升系統性能
我們都知道讀Cache是存儲系統常用的加速手段,就是把數據預先從硬盤中取出來,放在一個比硬盤更快的地方,通常用的介質是RAM。針對讀數據的任務,CPU會先去讀cache里面查找,找到了就反饋給前端接口卡,由前端接口卡傳送給用戶,如在cache中未找到才會去硬盤里面找。很明顯,最理想的情況就是所有的讀數據請求都能在讀cache里面找到數據,這樣是性能最高的。但是數據是雜亂的,任務是隨機的,怎么知道應該提前取哪些數據放在讀cache里面呢?
為了解決這個難題,華為OceanStor存儲Dorado系列首創引入人工智能模塊作為存儲系統插件,提升預測準確率。
圖一:AI模塊 + 智能算法
那么內置的AI模塊是怎么幫助提升預測準確率的呢?我們知道,存儲系統收到的數據是一份一份的,每一份我們叫做一個I/O。不同的業務,發送過來的I/O是千差萬別的。但是I/O不僅存在時空關聯,而且也存在語義關聯。時間關聯就像是8點后面是9點,空間關聯就像是中國的北面是俄羅斯和蒙古。語義關聯就像我們說“北極熊是世界上…”,后面大概率是想說“體型最大的熊”。I/O也是這樣,只不過我們需要把這些關聯挖掘出來。知道了這些關聯,自然就能提高預取的準確率了。
OceanStor存儲Dorado系列中的AI模塊集成了自調優的深度學習算法,可以對上層業務的全量I/O數據從時空關聯和語義關聯上進行快速分析和深度挖掘。當I/O過來后,它會立刻判斷出即將訪問的數據,并告訴CPU趕快取到讀cache中。同時,它還在后臺不斷對已有數據進行二次學習,進一步提升準確率。最后是通過對預取命中率、浪費率、時延等關鍵性能指標進行評估,然后自主調整。
經過華為性能實測,OceanStor存儲Dorado系列在同樣帶寬的前端卡(16G FC),同樣的測試模型(隨機讀,64K以內I/O數據塊大小),讀cache命中率從19%提升到69%。
總結一下:
OceanStor存儲Dorado系列中內置的AI模塊,就像汽車的智能變速箱,它通過持續的自我學習,逐步提升,讓存儲系統加速,越用越好用。
回顧過去兩年多的種種,張鵬感慨道:“OceanStor存儲Dorado系列實現了很多開創性的東西,這在業界非常難得,也是我倍感欣慰的地方。”
AI智能賦予了高端存儲新的生機,這正是Interop 評委團專家看到華為率先將AI模塊植入存儲系統中興奮的原因:OceanStor存儲Dorado系列,為業界樹立了智能創新的標桿!