大數據(big data),是指無法在可承受的時間范圍內用常規軟件工具進行捕捉、管理和處理的數據集合。以下是大數據的一般特點。
數據存儲量相對于當前企業TB(TERA BYTES)字節的存儲限制,定義在PB(PETA BYTES)字節,EXA字節以及更高的容量順序。
通常它被認為是非結構化數據,并不適合企業已經習慣使用的關系型數據庫之下數據的生成使用的是數據輸入非傳統的手段,像無線射頻識別(RFID),傳感器網絡等。
數據對時間敏感,且由數據的收集與相關的時區組成。
在過去,專業術語“分析”應用于商業智能(BI)世界來提供工具和智能,通過對各種各樣可能的信息視角的快速的、一致的、交互式訪問獲得洞察力。
與分析的概念非常接近,數據挖掘已經應用于企業以保持關鍵監測和海量信息的分析。最大的挑戰就是如何通過大量的數據挖掘出所有的隱藏信息。
企業數據的分析朝著在一段時間內在那種內容中的信息的有意義的洞察,是大數據分析區別于傳統數據倉庫分析的原因所在。下表總結了一些它們之間的差別。
大數據分析用例
基于用例,企業可以理解大數據分析的價值和在大數據分析的幫助下如何解決傳統的問題。以下是一些用法。
客戶滿意度和保證分析
也許這是基于產品的企業所擔心的最大的一個領域。
在當今時代,沒有一個清晰的方式來衡量產品的問題和與客戶滿意度相關的問題,除非他們以一個正式的方式出現在一個電子表格中。信息質量方面,它是通過各種外部渠道收集的,而且大多數時候的數據沒有清洗,因為數據是非結構化數據,無法關聯相關的問題,所以長期的解決方案提供給客戶,分類和分組的問題陳述都缺失了,導致企業不能對問題進行分組,從上面的討論中,對客戶滿意度和保證分析使用大數據分析將幫助企業在急需的客戶注意力設置中獲得洞察力,并有效地解決他們的問題以及在他們的新產品線上避免這些問題。
競爭對手的市場滲透率分析
在今天高度競爭的經濟環境下,我們需要通過一種實時分析對競爭者強大的區域和他們的痛點進行衡量。這種信息是可適用于各種各樣的網站、社交媒體網站和其他公共領域。對這種數據的大數據分析可以向企業提供關于他們產品線的優勢、劣勢、機遇、威脅等非常需要的信息。
產品功能和用法分析
大多數產品企業,尤其是消費品,不斷在他們的產品線上增加許多功能,但有可能一些功能不會真正地被顧客所使用,而有些功能則更多地被使用,對這種通過各種移動設備和其它基于無線射頻識別(RFID)輸入捕捉到的數據的有效分析,可以為產品企業提供有價值的洞察力。
未來方向的分析
研究小組分析在各種業務中的趨勢,而這種信息通過行業特定門戶網站甚至常見的博客可以獲得。對這種未來數據的不斷分析將有助于企業期待未來,并將這些期待帶入他們的生產線。
總結
大數據分析為企業和ZF分析非結構化的數據提供了新的途徑,這些非結構化數據到目前為止在典型的企業數據倉庫的情景中被數據清洗的慣例所拒絕。然而從以上用例明顯看出,這些分析在改善企業的運營方面有很長的路要走。我們在未來的日子里將會看到更多的產品和應用系統在這個市場上出現。