關于如何定義大數據和分析的總體架構的不確定性是中小企業在大數據和分析部署方面落后的原因之一。在很多情況下,對于混合計算、數據集市、主數據庫等趨勢發展情況,以及對安全和治理的控制將如何發揮,他們正在等待和觀望。
最后,將會提供一個大家都可以遵循的新興的最佳實踐數據架構。在這個架構中:云計算服務正被用于存儲和處理大數據,而內部部署數據中心用于在企業開發本地數據集市。
以下來仔細看看這個大數據和分析架構背后的原因:
云計算的作用
如果企業規模較小,那么購買在數據中心并行處理大數據的服務器集群是很昂貴的,更不用說雇傭或培訓那些知道如何優化、升級和維護并行處理環境的非常昂貴的專業人員了。選擇現場處理和存儲數據的企業也對硬件、軟件和存儲設備進行了大量投資。而采購大數據硬件和軟件,以及將計算處理和存儲外包給云端,所有這些都將花費大量的費用。
內部部署計算
數據治理(例如,安全和合規性問題)是企業不愿將所有任務關鍵型數據交付給云計算的原因之一,因為這些云計算數據的管理更加困難。因此,一旦數據在云端處理完畢,許多企業選擇將數據遷移到自己的內部數據中心。
許多企業選擇使用他們的數據中心還有另一個原因:關注開發這些數據的專有應用程序和算法,因為許多云計算提供商的政策是客戶在云端開發的任何應用程序可能會與其他客戶共享。
通過將應用程序保留在內部部署的數據中心,并開發一個可以將較小的數據集市從中分離出來的本地主數據集,企業可以直接控制其數據和應用程序。
分析管理者需要什么?
(1)企業應該了解并同意其云計算提供商處理和保護自己的數據
例如,如果企業需要對數據進行匿名化處理,則應該將其實施的過程記錄下來,并與其云計算提供商達成一致,因為云計算提供商將進行匿名化處理。如果企業想清理自己的數據,其清理的過程也應該向其云計算提供商提供詳細的書面說明。例如,企業是否只希望將美國所有州的縮寫進行統一(例如,“Tenn”和“Tennessee”=“TN”)還是要對數據進行其他編輯,以便統一且易于處理?最后,無論企業的業務是運行在云計算服務提供商的專用租戶還是多租戶環境中,云計算提供商都應該能夠保證企業的數據永遠不會與其他客戶共享。
(2)企業的本地大數據和分析架構應該記錄符合大數據需求的新政策和程序
企業的許多IT部門完全錯過了這個任務。他們只是開始實施大數據項目,卻忘記現有的應用程序開發政策和程序來自交易的應用領域。企業不要犯這個錯誤。與其相反,企業需要在與大數據交互的可能性較高的領域(如存儲、數據庫管理、應用程序)中修改政策和程序。
(3)災難恢復計劃應在內部部署和云端部署時更新和測試大數據
在進行基于云端的災難恢復(DR)測試的情況下,企業應該在合同中包含用于記錄和執行災難恢復(DR)的規定。災難恢復(DR)計劃(側重于事務數據和系統)也應該及時更新,并包括大數據和分析的恢復和測試腳本的恢復。
版權聲明:本文為企業網D1Net編譯,轉載需注明出處為:企業網D1Net,如果不注明出處,企業網D1Net將保留追究其法律責任的權利。