對于企業而言,大數據不僅是個熱門話題,更是真切的需求所在。許多企業開始著手于大數據分析項目,但是現在,越來越多的企業存儲的信息量就算不是PB級,起碼也有TB量級……
大數據的能量和其為企業帶來的競爭力優勢已經逐漸顯現,現在大數據已經成為商業智能、分析和數據管理市場領域中討論度最高的話題之一,當然也是最熱門的流行語之一。此外,企業已經看到了將大數據與云計算綁定所帶來的好處。云計算提供可擴展性,使得其成為大數據分析的實踐之車。
對于企業而言,大數據不僅是個熱門話題,更是真切的需求所在。許多企業開始著手于大數據分析項目,但是現在,越來越多的企業存儲的信息量就算不是PB級,起碼也有TB量級。這些企業可能希望每天能分析幾次關鍵數據,甚至是實現實時分析;而傳統BI流程對歷史數據進行分析的頻率是以周或月為單位的。
此外,越來越多復雜查詢的處理帶來了各種不同的數據集,其中有可能包含來自企業資源計劃(ERP)系統和客戶關系管理(CRM)系統交易數據、社交媒介和地理空間數據,還有內部文檔和其它格式信息等等。
要進行大數據分析,選擇合適的技術是規劃的第一部分,企業選擇了數據庫軟件、分析工具以及相關的技術架構后,才可以進行下一步并開發一個真正成功的大數據平臺。技術供應商處理這些需求的方式是多種多樣的。許多數據庫和數據倉庫供應商都在關注及時處理大量復雜數據的能力。有的用列式數據存儲來實現更快速的查詢,有的提供內建的查詢優化器,有的增加對Hadoop和MapReduce這類開源技術的支持功能。
內存分析工具可能對分析處理速度的提升有所幫助,因為它能減少磁盤數據轉換的需求;而數據虛擬化軟件和其它實時數據集成技術可對運行中不同數據源的信息進行收集。對于垂直市場而言,現成的分析應用程序都是專門為其定制的,因為諸如電信、金融服務和網絡游戲這些行業都必須處理大數據。當公司管理人員和業務經理需要查看大數據分析查詢結果時,數據可視化工具可以簡化其流程。
企業在在制定實施方案、對大數據基礎設施進行選型之前,還需要考慮一些問題,比如數據及時性,因為并不是所有數據庫都支持實時數據可用性。各種數據源需要與數據關聯性和業務規則復雜度進行鏈接,以獲得一個包含企業績效、銷售機會、客戶行為、風險因素和其它業務指標的全面視圖。由于分析的需要,歷史數據的數量也需考慮在內。如果我們需要五年的數據,而一個數據源只包含兩年的信息,那么該怎么辦呢?然,這些因素并不能從根本上影響需求的規劃,但是它們可以幫助企業部署大數據分析系統、選擇最為合適的技術。
大數據正在以穩定的步伐滲透到各行各業,未來我們的生活中大數據的應用會越來越多,而對于企業而言,其整個企業的信息質量會變得更好,而且信息能夠更高效的得到利用。