談論數據的海量規模、多樣性和急劇增長已是司空見慣,專家每次都會反復地對企業所產生的龐大數據做出聳人聽聞的預測。而他們給出的建議是,如果不采取根本性的措施,那么用于存儲和保護所有這些數據的系統會瀕臨崩潰邊緣。
本文卻有不同看法。在這篇文章中,我們不僅將數據洪流視為一個存儲問題,還將它視為一次數據優化的機遇。之后,我們將重點談論英特爾® 傲騰™技術,這項技術在充分利用數據優化機遇方面將發揮重大作用。英特爾® 傲騰™技術是 20 世紀 70 年代以來首個真正意義上的新內存技術(DRAM 起源于 1966 年,是 20 世紀 70 年代早期的固態盤的前身)。這項技術可作為現代企業數據策略的一部分,從根本上改變企業數據性能及與此相關的開銷。
對企業數據策略的迫切需求
企業數據存儲確實面臨諸多挑戰。其中不僅包括數量(volume)、多樣性(variety)和速度(velocity)方面的挑戰。還包含其他同等重要的難題,這些問題綜合起來,導致企業迫切需要構建全面的企業數據策略。
除了“三個 V”之外,IT 組織還面臨著巨大壓力,必須以不同于以往的方式使數據變得更有用。隨著數據分析和人工智能(AI)應用對業務的重要性與日俱增,這意味著數據必須是可訪問和可查詢的,且通常要近乎實時的,但當今的存儲架構在設計時情況并非如此。高性能計算(HPC)應用需要將龐大的數據集存儲在內存中,或者存儲在性能盡可能接近內存的存儲設備中。實時的流傳輸應用(例如,金融服務領域中的應用)需要采集數據,并將數據存儲在非常靠近計算節點的超快速存儲設備中。上述這些需求會直接影響某些數據層的識別和存儲方式。
隨著企業需要使用更多數據來做更多更重要的事情,存儲的數據也開始分布在不同位置上。物聯網(IoT)應用,無論是自動駕駛汽車、智能城市還是智能零售,都需要在接近數據生成地點的位置存儲和處理數據。從某種程度上講,數據中心正在分解,并且一些類似數據中心的技術出現在了網絡邊緣,所有這些都需要采集、存儲和分析數據。
最后,我們要面對成本挑戰。存儲的總體擁有成本(TCO)一如既往地重要,但是成本計算難度卻在不斷增加。這個成本不僅僅是指在類似保險庫的冷存儲中存儲和保護數據的成本,還涉及在需要時訪問和分析數據所產生的操作成本?;鶞蕼y試需要體現不斷變化的實際工作負載,而不是簡化的理想狀態。因此,綜合起來,這些因素決定了企業需要一種全面的方法實現現代企業數據策略。
構建企業數據策略
IT 必須創建一個智能數據策略,這個策略不僅要有效地安全存儲數據,而且還要預先定位數據以供應用實時使用或日后使用。了解應用和位置要求(訪問速度和連續性,靠近計算節點的位置等)實際上意味著,要了解數據策略所須支持的業務流程和應用。除了數據洪流外,其他老生常談的 IT 言論為“IT 必須更接近業務”。
這一言論在數據策略方面尤為貼切。在了解了圍繞數據分析或人工智能構建且有利于實現競爭優勢的應用,并對這些應用可能移向網絡邊緣的方式有所了解后,IT 能構建一個直接決定企業成敗的數據策略。
英特爾認為,一個成功的現代數據策略應該是軟件定義的策略,以應用要求為基礎,并能實現智能分層。本文將重點關注數據分層,以及英特爾® 傲騰™技術在這當中發揮的作用。適用于數據分層的戰略性方法如下:
• 了解當前的應用數據要求:數據和使用數據的應用之間有怎樣的關系?如何使用數據?對于延遲和可用性有哪些要求?誰需要訪問數據,以哪種方式訪問?哪些應用是業務關鍵型應用?
• 規劃未來數據要求:哪些未來應用會產生具有挑戰性的數據要求(性能、位置或成本)?長期業務計劃對數據要求的影響有哪些?
• 創建數據層次結構:數據無處不在,既存在于企業內部,也存在于企業外部。大多數應用策略需要各類數據。務必了解各種結構化數據庫和非結構化數據庫之間的關系。數據建模可為整個企業提供層次結構,并且通常是數據分析策略執行過程中確保成功的一個重要因素。
• 考慮企業層面的影響因素:由業務目標驅動的數據策略需要應對影響存儲環境和數據分析策略的各種因素。其中包括數據可用性、數據隱私、數據保留、合規性(企業需要遵守的數據相關法規)、數據搜尋和數據清潔度。
在這個流程的結尾,企業應該創建一張關于當前和未來數據層次結構的 3D 圖,并且能夠開始對層次結構進行分層。大多數 IT 部門會用溫度這個概念來理解數據。“冷”數據幾乎不會被訪問,但需要安全地存儲起來。而與之相對的“熱”數據則會被頻繁、快速且安全地訪問。當然,要能夠根據應用和安全需求在各個層級之間移動數據。
許多企業將“冷”數據存儲在磁帶存儲器或云中。“暖”數據可以放心地存儲在磁盤上。而問題就在于極暖的數據和“熱”數據的存儲?,F代應用需要以更快的速度獲取越來越多的數據。因此,回到本文開頭的地方,數據洪流應該有四個矢量:數量、速度、多樣性和熱度。越來越多的數據會是(或者在理想狀態下將是)熱數據。這就會給 IT 帶來實際的成本問題和技術難題,而這正是英特爾® 傲騰™技術的用武之地。
英特爾® 傲騰™技術:打破傳統的數據分層模型
傳統意義上,我們一直根據訪問需求在介質上進行數據分層和存儲,而這些介質的成本和性能正在不斷提高:
• 磁帶價格便宜,但速度慢
• 硬盤價格適中,速度適中
• 固態盤(SSD)價格較高,速度更快
• DRAM價格極昂貴,速度也極快
• 處理器緩存的價格最昂貴,速度也最快(但是在大小方面有嚴格的限制)。
一些企業使用云存儲來存儲冷數據,因而這個模型在某種程度上已在低端中斷,但是在暖/熱數據方面,要實現成本和性能之間的平衡仍是一個棘手的問題。
英特爾® 傲騰™技術是一項全新技術,盡管它的速度沒有 DRAM那樣快,但也足以用作擴展的內存池,并且它的響應速度甚至比高性能 NAND 固態盤還要快。這意味著,對于許多應用而言,英特爾® 傲騰™技術可以提高媲美內存的性能,從而為暖數據或熱數據提供一個更高性能的解決方案,這個解決方案在性能方面優于磁盤,在價格方面低于 DRAM。
圖 1.英特爾® 傲騰™ 技術為存儲基礎設施引入全新的存儲層
實際上,英特爾® 傲騰™技術將內存和存儲的特性與低延遲、高耐久性、高服務質量和高吞吐量結合在一起。它創建了一個新的數據層,并且對于在當今企業環境下能夠提升競爭優勢的以下應用尤為有用:高級分析、人工智能和高性能計算。
在現今的架構中,存儲和內存之間的界限變得很模糊,這意味著會加快實現快速存儲并擴展緩存。英特爾® 傲騰™技術增加了每臺服務器的規模,并降低了事務處理成本。通過與最新的英特爾® 至強® 可擴展處理器結合使用,英特爾®傲騰™固態盤支持部署更大且更經濟實惠的數據集,以便通過更大的內存池獲得新洞察。
將英特爾® 傲騰™固態盤用作快速存儲或緩存設備后,許多應用將從中受益。這些固態盤提供了實現新的更高性能緩存或層級所需的性能,并且用作直連存儲時,能夠為最嚴苛的應用或服務提供極低的延遲。在這些應用中,英特爾® 傲騰™固態盤將大幅提高性能、打破存儲瓶頸、增強工作負載擴展能力,并降低總部署成本。與DRAM 相比,能夠使用更大容量和更低成本的設備讓企業有可能通過替換部分DRAM 組來節省成本;或者通過增加DRAM 來發展成為更大的內存池,從規模和復雜性日益增長的數據集中獲取新的洞察。
圖 2.英特爾® 傲騰™ 技術支持實現更快的存儲和緩存,并幫助擴展內存
英特爾® 3D XPoint™技術 - 英特爾® 傲騰™技術的核心
英特爾® 傲騰™技術的核心是英特爾® 3DXPoint™技術(發音為 cross point),該技術以材料科學的巨大進步為基礎,采用了全新的內存方法。
英特爾® 3D XPoint™技術將材料的亞微觀層切分為多個列,每列包含一個內存單元和一個選擇器。它使用垂直線纜連接各個列,并采用了創新的交叉點結構,可以通過在頂部和底部各選擇一根線纜來單獨尋址內存單元。可以從三個維度堆疊這些內存網格,以提高存儲密度。DRAM 需要為每個內存單元使用一個晶體管,因而在大小和成本方面產生了不良影響;而與之不同的是,每個英特爾® 3D XPoint™內存單元可以通過改變線纜中的電壓來實現輕松寫入或讀取,完全不需要晶體管。
內存單元會保持持久狀態,這意味著它們即便被斷電,也會保留它們自己的值。這些功能共同提供了快速、密集和非易失特性,使英特爾® 傲騰™技術成為模糊存儲和內存之間界限的完美選擇。
對于某些工作負載而言,英特爾® 傲騰™固態盤將內存池的大小提高了多達8 倍1,并將 DRAM 替換為至多 10:12。隨著時間的推移,英特爾® 傲騰™技術將在其他產品中提供,這將釋放生態系統的創造力,以便根據不斷發展的應用和位置需求重塑更高要求的性能計算。
英特爾的存儲產品組合
英特爾® 存儲解決方案以基于標準的技術為基礎構建而成,它可以降低風險,并能在多個供應商或開源解決方案間靈活實施您選擇的存儲架構。
通過與英特爾® 傲騰™技術結合使用,英特爾® 3DNAND 固態盤改變了存儲基礎設施的經濟性,同時在可擴展性、性能和選擇靈活性之間實現了全新的平衡,可加快數據密集型應用的交付,降低延遲敏感型工作負載的事務處理成本,并降低整個數據中心的 TCO。
英特爾® 傲騰™技術的基準測試:真實的基準測試揭示了超凡的企業數據中心性能
人們通常在高隊列深度下評估存儲性能,這個隊列深度實際是指任何時候的存儲數據并發請求數。大多數 NAND 固態盤的測量值都是峰值性能,此時的隊列深度通常為 128 或更高。此外,測量 NAND 固態盤的性能時通常采用 100% 讀取或 100% 寫入工作負載。但這些都不是常見的工作負載。企業應用中的大多數典型工作負載混合了讀取和寫入,隊列深度在 8 到 12 之間。
許多企業應用,尤其是操作型數據庫、存儲緩存、日志文件和類似的性能或任務關鍵型應用,均要求系統有良好的響應能力。這意味著通常會限制指定給任何一臺存儲設備的工作規模。事實上,這些類型的工作負載所達到的隊列深度高于 4 到 12 之間的情況并不常見。
英特爾使用了極常見的混合工作負載(70% 的讀取和 30% 的寫入)對英特爾® 傲騰™技術進行了測試,這種混合工作負載常見于數據庫的事務處理中。我們還在存儲設備上展示了 1 到 16 范圍內隊列深度的情況 -出色的 I/O 性能。在這種情況下,NAND 固態盤達到的性能越高越好。英特爾® 傲騰™技術可將關鍵方面的性能提高5-15 倍2。
• 對于 70/30 混合工作負載,英特爾® 傲騰™ 技術在 QD1 下實現的性能是高耐久性NAND 固態盤(P3700)所實現性能的 15 倍
• 英特爾® 傲騰™ 技術可在 QD12 下達到最大吞吐量,而大多數基于 NAND 的固態盤需要在隊列深度達到 100 或更高的情況下才能實現最高性能
• 英特爾® 傲騰™ 技術將延遲降為以前的十分之一(延遲< 10 微秒)
• 英特爾® 傲騰™ 技術將 QoS 提高了 100 倍(讀取/寫入 < 200 微秒99.999th)
• 英特爾® 傲騰™ 技術提高了讀取速度(7 微秒對比70 微秒),這得益于介質的物理特性(每個 IO 的速度提高了10 倍,因此您能夠以更快的速度實現峰值吞吐量)
英特爾® 精選解決方案(Intel® Select Solution)提供針對工作負載經過優化的配置,所包含的現代英特爾® 固態盤已經過驗證,可適用于基于英特爾® 至強® 可擴展處理器的平臺,并且旨在幫助加速存儲現代化舉措。當企業選擇英特爾® 精選解決方案時,他們可獲得超融合基礎設施所需的最佳性能,且無需耗費時間和精力去調優堆棧。
英特爾目前正在促進行業范圍內的協作和創新,以便為客戶提供多個解決方案,利用存儲經過優化的平臺、組件和軟件提供現今企業所需的性能和效率。
英特爾® Storage Builders 提供了一個開放的協作環境,以實現真正的存儲創新和進步。該計劃匯集了眾多具有前瞻性的公司、廣泛的英特爾生態系統、關鍵基礎技術和戰略資源,使我們的成員能夠推動存儲向前發展。
實現數據策略現代化
企業需要清楚認知自身的應用和架構需求,了解如何讓數據融入其中,以便應對未來的數據挑戰。之后,這些企業需要繪制一張清晰的路線圖,以實現存儲現代化,從而為他們的數據策略提供支持。
另一種選擇是抑制數據增長,但這會導致成本上升并錯失商機?,F代化策略的關鍵在于數據分層,而英特爾® 傲騰™技術通過模糊內存和存儲之間的界限,采用全新的分層方法為實時和數據密集型應用提供支持