但GenAI的出現也帶來了“(數據)包袱”。企業需要大量信息來構建和訓練GenAI模型,這些模型也會相應地產生大量數據返還給企業。因此,每位企業領導在采用AI和GenAI之前都必須問自己:我們的存儲解決方案是否能夠勝任這項任務?
在2024年及以后,正是那些擁有可擴展、安全且經濟的數據架構的企業,才能從AI賽道上的眾多“選手”中脫穎而出。
GenAI時代的存儲解決方案
想要成功部署GenAI,企業必須通過重新構思、設計和優化其存儲方案來有效應對GenAI的龐大數據管理需求。這樣做能夠使企業避免因存儲不足或設計不當而拖慢流程。
現實中,傳統的存儲系統已經無法跟上數據爆炸式增長的速度。GenAI系統不斷發展,處理的新任務越來越復雜,因此對存儲系統的要求也只會越來越高。換言之,存儲平臺必須能夠匹配情況更加復雜的非結構化數據(又稱定性數據)以及GenAI所帶來的新需求。
事實上,非結構化數據占每年生成數據量的90%以上。造成這一情況的主要原因是人為數據的增加,而這部分數據則充斥著雜亂無章的列分析。企業需要采用新的辦法來經濟高效地存儲大規模且復雜的數據,同時還要能夠方便、快捷地訪問數據并防止網絡犯罪分子的入侵。非結構化數據由于其價值和龐大的體量,尤易成為黑客的目標。
簡言之,企業想要擁有并期待更佳的數據移動、訪問、可擴展性和保護體驗。許多企業將云優先戰略作為權宜之計,把數據存儲在多個公有云環境中。雖然這在短期內的確是一個辦法,但從長遠來看,企業將面臨不斷攀升的進出成本、安全問題以及數據優化方面的挑戰。為了讓GenAI真正發揮作用,企業需要能夠簡單、方便地訪問數據,而一個云優先的戰略則很難做到這一點。
因此,企業應轉而采取multicloud by design的方法。這將幫助其在短期和長期均可解鎖多云的全部潛力,免受孤立的專有工具和服務生態系統的限制。通過設計多云,企業實現了多云環境中數據存儲與保護的管理統一。
投資新的存儲技術
企業需要新的方法滿足GenAI的特定要求和龐大多樣的數據集。這些前沿技術包括分布式存儲、數據壓縮和數據索引。
· 分布式存儲通過將數據存放在多個位置提高GenAI系統的可擴展性和可靠性。例如在需求增加的情況下,企業可以跨多個節點快速擴展其存儲需求,還可以復制其最關鍵的數據并將該數據保存在一個單獨的位置以便在受到網絡攻擊時輕松檢索。
· 許多企業面臨的另一大問題是成本。不過,企業可以通過數據壓縮來緩解這個問題。數據壓縮可以去除無用數據,減少企業的存儲需求。通過更有效的數據分析和刪除不必要的信息可以得到更精煉的版本,這反過來又減少了企業所需的存儲量,從而節省成本。
· 數據索引則能夠提高檢索能力,通過更加高效地將數據放置到特定位置,有助于實現更快、更有效的搜索和訓練能力。
上述三項技術的結合提升了數據存儲的性能和效率,并節省了更多成本。對于尋求實現GenAI技術無痛過渡的企業領導來說,這三點是關鍵優先事項。
一步躍進時代前列,即刻引入并驅動有效訓練和建模的想法雖然誘人,但要想取得成功,企業必須首先為GenAI奠定堅實的存儲基礎。盡管這可能不是企業領導最感興趣的領域,但企業存儲和管理數據的方式將在未來給企業帶來更大的商業價值。
AI和GenAI既給企業帶來了競爭優勢,又為市場帶來了變革。但務必注意以正確的方式進行部署,而不要在毫無準備的情況下盲目加入AI賽道,保證自己處于最佳的狀態。前方機會無數,而企業只有采用具有前瞻性的技術,才能真正做到“近水樓臺先得月”。