標準組織推出的新技術獲得“官方定義”并不多見。但要獲得這樣的“定義”,這項技術需要相當大的突破。因此,希望正式引入計算存儲(CS)——這是一種淘汰傳統計算機存儲技術的存儲架構,以提供一種更快、更經濟、更省電的方式來存儲和分析PB字節的數據。
企業存儲的發展
簡而言之,計算存儲是一種IT架構,其中數據在存儲設備級別進行處理,以減少必須在存儲和計算平臺之間移動的數據量。因此,該技術提供了一種更快、更高效的方法來應對數據密集型世界的獨特挑戰,通過減少數據移動和允許對分析的響應速度高達20到40倍來滿足減少的多余帶寬,并提供非常低的延遲響應時間。
如果考慮一下企業存儲的發展歷史,計算存儲的發展速度是適當的。得益于NVMe和NVMe Over Fabrics輔助的新閃存技術,該技術的發展越來越快。當今的數據中心(包括超大規模數據中心)主要依賴于使用馮·諾依曼體系結構的基本方法構建的傳統服務器硬件,馮·諾依曼體系結構適用于幾乎所有通用服務器,是具有70年歷史的計算機體系結構,坦率地說,這種體系結構多年來從未經歷過太多的變化。
而一些新方法并沒有取得太大的成功。現在有了諸如人工智能和機器學習之類的應用程序,這些應用程序需要大量的原始數據(結構化和非結構化),這些數據需要高計算能力來“學習”,因此計算能力已成為瓶頸。在傳統的橫向擴展模型中,此問題通過添加節點來解決,從而獲得更多的分布式計算能力和更多的內存。不幸的是,從投資成本和運營成本角度來看,添加服務器節點的成本很高。添加更多節點還增加了互連的長度,從而增加了數據移動和分析所需的時間。
計算存儲這種技術可以將傳感器(例如自動駕駛汽車、視頻監控攝像頭、交通信號燈)中的原始信息巧妙地組織為有意義的數據,因為缺乏移動性可以促進實時數據分析,從而通過減少輸入來提高性能/輸出瓶頸。隨著人工智能、機器學習、物聯網工作負載涌現出驚人的數據量(IDC公司的研究表明,到2025年,數據總量將超過163 ZB,其中95%是由物聯網設備生成的),這項新技術是真正缺失的環節。
調研機構Dimensional Research公司最近對300多位計算機存儲專業人員進行的一項調查揭示了這一挑戰,表明存儲瓶頸可能發生在10 TB以下。這樣,計算存儲可以提供更強大的處理能力來輔助每個主機CPU,從而使組織可以提取其可以生成的所有數據,并僅提供真正需要的數據,從而使“管道”盡可能保持開放。這樣一來,就可以收集更多分析所需的原始數據,并為組織提供僅從該數據中提取實現價值所需的自由。在比較中,當組織必須處理整個數據集時,就會延誤增值。這種方法可最大程度地提高效率,減少功耗,并降低運營成本。這種“分類、轉換、發送”方法使快速、全面和有意義的實時數據應用成為可能。
計算存儲的官方定義只花了一年時間就制定出來了,這是一個相當迅速的過程,證明了對這種截然不同的計算機存儲技術的迫切需求。一年多前,存儲網絡行業協會(SNIA)召開會議,研究如何圍繞計算存儲技術定義和制定標準。SNIA是一個非盈利組織,由198家信息技術領域的成員公司組成。經過幾個月的會議和一些辯論,他們現在已經制定了官方定義:
•“計算存儲體系結構可通過集成計算資源(直接與存儲、存儲附近或主機與存儲之間)集成來提高應用程序性能和/或基礎設施效率。這些計算資源不在傳統的計算和內存體系結構之外。
•這些體系結構的目標是:啟用并行計算;減少I/O流量;減輕對現有計算、內存、存儲和I/O的其他限制。”
受益于計算存儲的行業
當將計算存儲應用于多個用例時,將變得更易于理解。要求計算存儲技術強大和高效的行業示例是新型“智能”汽車和即將推出的全自動駕駛汽車,這些汽車必須處理數據負載(每天高達28TB)以進行分析,否則可能會影響駕駛員的安全性。一些設計計算存儲架構的公司已經能夠提供利用小型化技術的技術,該技術可以與SSD硬盤一起使用來處理數據負載。這在空間受限的邊緣相關(例如汽車)中效果很好。但是,盡管外形尺寸很大,計算存儲解決方案仍可以將功能提高20倍甚至更多,并且使支持人工智能的系統能夠以前所未有的方式讀取和分析數據。
在數以千計的物理服務器和數百萬個虛擬機上運行的超大規模數據中心(例如AWS的數據中心基礎設施)必須并行執行各種工作負載。這些超大規模數據中心開始使用計算存儲驅動器(CSD)來處理PB級的數據,同時也帶來了體積小、功耗低但仍具有巨大計算能力的更小尺寸的優點。這樣,體積小巧但功能強大的計算存儲驅動器(CSD)可以幫助提高超大規模架構的計算能力,這些超大規模架構將機器用于人工智能(AI)和機器學習(ML)應用程序,而這些應用程序通常需要諸如實時、復雜和并行索引的操作和模式匹配。
例如,出于欺詐檢測目的而需要實時分析大量數據以獲取銷售點數據的零售企業,也可能會受益于計算存儲更快的響應時間。Storage Switzerland公司發布的調查報告指出,“這些應用程序必須在執行分析請求之前掃描大量數據,以識別與查詢相關的信息子集。將大量數據移出存儲系統,跨網絡并移入主機內存會導致時間和延遲損失,這是實時分析應用程序無法承受的。”
內容交付網絡(CDN)是利用計算存儲技術的另一個市場。在這里,該技術可以幫助進行加密/數字版權管理(用于驗證用戶可以訪問內容)。在這種情況下,計算存儲通過安全地解鎖內容而不共享密鑰來提供更好的數據管理。這種將每個服務器機架的密鑰匹配提高40倍的能力僅僅是這項工作的開始。
總結
事實上,在當今數據密集的世界中,更少的數據移動是至關重要的。數據移動的成本不僅僅是時間,還有資源,有時還會浪費分析資源。現在是采取下一步存儲和實施NVMe計算存儲驅動器的時候了。按照數據的步驟進行操作,注意在硬盤驅動器內部做了多少工作將節省數據移動時間,這將提高效率,并減少主機CPU和內存負載的采用。
版權聲明:本文為企業網D1Net編譯,轉載需注明出處為:企業網D1Net,如果不注明出處,企業網D1Net將保留追究其法律責任的權利。