基于AI的存儲將使組織能夠快速、智能地分析數據,幾乎在瞬間就可以獲得洞察力。
如果你能夠把存儲想象成一輛自動駕駛汽車,而不是一個需要親自動手的、勞動密集型的必需品呢?如果是像自動駕駛汽車一樣,你的存儲基礎架構也能夠預測你需要什么,并在道路上進行路障導航呢?
根據你對新技術的容錯性和你公司的文化,你可能已經利用了從應用程序的行為中學習、識別應用程序和配置中的異常并使用這些信息來預測和預防問題的技術了。
為這些核心技術賦能的正是人工智能。事實上,人工智能正在經歷一個特殊的時刻,根據專家的說法,這種情況不太可能很快改變。麥肯錫最近的一項調查發現,近一半的公司目前在某些方面使用了人工智能,但絕大多數公司仍然預計,它們在人工智能領域的投資將在未來幾年繼續增加。
在滿足當今的存儲需求方面,人工智能也正在迅速變得至關重要。它能夠使如此多的數據如此快速、智能地得到分析,并有助于避免瓶頸、可用性問題和安全問題。基于人工智能的存儲將允許IT員工在滅火上花費更少的時間,并提高基礎架構的可用性和生產效率。
HPE Storage的產品營銷總監王大偉表示,該公司的目標是創建一個自動的、人工智能驅動的基礎設施,幾乎可以在瞬間提供洞察力。
“我們希望達到這樣一個境界,即洞察力可以推動即時可見的變革,”他說。“有一種觀點認為應該有端到端的人工智能管道,從本地的邊緣一直延伸到云。”
從不同的角度看待問題
人工智能改變了存儲的任務,這意味著企業也應該以不同的方式看待存儲和數據,IBM存儲營銷總監Doug O'Flaherty說。
“你必須停止把存儲看作是數據庫或特定用例所需要的東西,而是要考慮如何以不同的方式來訪問來自不同部門的數據,”他說。“如果你能讓數據科學家或組織中其他跨部門職責的人訪問這些數據,你就能進入到下一層次的數據分析,這將是真正改變存儲的一個關鍵任務。”
除了從更廣泛的角度來考慮外,重要的是要采用一種更加以應用程序為中心的方法來進行存儲,而不是傳統的以數據為中心的方法。
“在大數據人工智能世界的1.0版本中,公司認為他們必須是由數據來驅動的。因此,他們專注于將所有數據存儲在存儲庫中以及該組中的所有人工智能人員,“Splice Machine首席執行官Monte Zweben解釋說,該公司專注于分布式NoSQL數據庫技術。
結果,他說,這些數據湖往往很快就變成了“數據沼澤”,這主要是因為負責業務流程的人沒有考慮到這些業務流程中所使用的數據和應用程序。
通過關注應用程序而不是數據,你將能夠更好地將存儲及其功能與業務匹配起來。例如,處理大量索賠(業務流程)的保險公司將與負責索賠系統的索賠專家和應用程序開發人員一起來確定一個應用程序。通過把它們放在一起,他們可以更好地決定如何使用這些數據來創建一個智能索賠處理系統。
“這是為了讓應用程序能夠更智能地處理數據,而不是試圖收集世界上的所有數據,然后把它們提供給那些可能對索賠感興趣的人,”他說。“這是一個簡單的想法,但它可以對企業如何實施人工智能產生深遠的影響。”
建立一個成功的基于AI的存儲基礎設施也意味著解決了人工智能存儲管道中的三個不同的階段:數據攝入(從不同的環境中攝入和規范化數據,這樣你就可以將其看作為一個整體),培訓(使用機器學習研究數據來理解它真正的內容)和推理(提供見解的階段)。
要滿足這些要求,存儲基礎設施必須能夠支持非常高的容量、長期的數據保留和高性能處理。換句話說,大規模的人工智能也需要大規模的能力、保留率和性能。
Storage Switzerland的首席分析師George Crump表示,支持高存儲容量的能力是至關重要的。組織很少刪除用于訓練人工智能工作負載的數據點,因為獲取這些數據的初始成本很高,他說。此外,這些數據集也不遵循典型的數據訪問模型,即隨著年齡的增長,使用的機會將會減少。“人工智能工作負載需要重新處理舊訓練數據的幾率幾乎為100%,因此整個數據集需要時刻保持易于獲取,”他補充道。
長期的保留也同樣重要,特別是當存儲容量不斷增加時。
“我們的意思是,機器將根據輸入的數據來做出決策。這意味著數據不能被刪除。它將持續增長,”O'Flaherty說。“你擁有的數據越多,應用人工智能的準確性和效率也就越高。”
除了簡單地存儲更多的數據之外,你還必須存儲更多類型的數據。其中包括有關數據(元數據)的數據,許多人認為,這些數據正在成為最有價值的商品之一,尤其是在數據治理方面。
第三個要求是高性能處理。
“訓練人工智能應用程序是一個迭代的過程,(而且)提高精確度也會是一個反復訓練的過程,調整人工智能算法,然后再次訓練,”Crump說。“迭代的速度越快,開發人員制作的模型就越精確,這也就增加了存儲基礎設施的壓力。”
在大多數人工智能工作負載中,關鍵是要確保這些環境中的標準圖形處理單元(GPU)保持盡可能的繁忙,Crump說。取決于人工智能的工作負載,一個有許多節點、混合了閃存和硬盤的擴展存儲系統是有意義的,Crump說。“人工智能的工作負載往往是非常并行的,而一個并行的、向外擴展的存儲集群即使在硬盤驅動器上也可能會遇到挑戰,”他說。
充分利用人工智能
對于剛起步的公司來說,通過從系統中提取數據并將人工智能方法應用于選定的數據集來尋找相關性,可以簡單地擴充現有的數據。不過,最終你會想要深入一點。一旦將關鍵的應用程序和系統綁定在一起,要想獲得人工智能的真正好處,就可能需要部署新的基礎設施和新的處理數據方法。
你選擇的基于人工智能的存儲系統應該具有快速管理元數據的智能,并能夠在正確的存儲類型上存儲正確的數據類型。Crump說,如果你選擇在本地運行基礎設施,你就可以從全閃存存儲系統開始,但最終將其遷移到閃存和硬盤的混合環境也是有意義的。通常,環境還將包括軟件定義的存儲,它可以自動在環境之間移動數據。
有些組織則更喜歡把所有東西都保留在本地--尤其是那些有敏感的工作負載和遵從性/數據治理問題的組織--而其他組織則可以從基于云的人工智能/存儲環境中獲益。
“這其中有很大一部分是發生在云計算領域,因為云計算需要共享計算能力和數據,”HPE公司Nimble Storage的產品管理高級總監Rochna Dhand表示。“你從任何人工智能模型中得到結果的質量都會取決于訓練這些模型的可用數據的多樣性和數量,所以使用一個從云端收集全球數據的系統是很有意義的。”
同時,Dhand也說,HPE正在研究如何將HPE Insight在云端提供的相同類型的全球數據分析應用到用戶的內部環境當中。她說,這樣做的目的是為了把在云計算中獲得的經驗整理成代碼,并將其作為防火墻后面的本地更新應用。
Dhand相信,隨著時間的推移,技術會不斷發展,基礎設施管理也最終將會完全自動化。“你將能夠預測并預防比現在更多的問題,而且你將對這些預測和預防更有信心,”她說。“你將不僅能夠預測問題并確定解決問題的方法,還能夠進一步的確定正確的解決方案并采取行動。”
版權聲明:本文為企業網D1Net編譯,轉載需注明出處為:企業網D1Net,如果不注明出處,企業網D1Net將保留追究其法律責任的權利。