大數據的例子
汽車制造商已經開始使用大數據來了解汽車何時需要返回到車庫進行維修。使用汽車發動機的數百個傳感器,可以為汽車制造商發送實時的數據信息,這使得制造商甚至比駕駛汽車的司機還要提前知道汽車何時會出現故障。卡車制造商開始使用大數據,基于實時交通條件和客戶的需求來改進他們的路由,從而節約燃料和時間。
零售業也開始越來越多的使用大數據,鑒于越來越多的產品均有一個RFID標簽能幫助零售商跟蹤產品,知道很少某種產品庫存缺貨,并及時向供貨商訂購新產品。沃爾瑪便是這正確利用大數據這方面的一個很好的例子。當零售商開始識別他們的客戶時,就能夠更好地建立商店,更好的滿足客戶的需求。
當然,上述這些只是幾個淺顯的例子,大數據的可能性幾乎是無止境的。不久的將來,我們將討論在大數據平臺上的最佳實踐。知道大數據能夠提供商業價值是一回事;而企業要知道如何創建正確的架構則又是另一回事了。
大數據結構
大數據有三個特征,使得大數據不同于現有的數據倉庫和商業智能。大數據的這三大特點是:
數據量龐大:大數據的數據量相當龐大,更多的時候大數據的數據量可以達到比數TB到PB級字節。
高速度傳遞:所有這些TB和PB字節的數據能夠實時交付,數據倉庫每天都需要應付如此高速的數據流。
種類繁雜:大數據比使用現有的商業智能中正常數據的種類更繁雜。大數據還包括非結構化社交數據,如Twitter或Facebook網的社會信息、日志文件、電子郵件等。
根據這些特性,建立您企業的體系結構是非常重要的。一個很好的出發點是以企業現有的數據倉庫為基礎。高密度數據的數據倉庫,其中包含用于當前商業智能的儀表板。重要的是,該企業是為了之后再移動到大數據。把大數據轉移到您的企業有如下四個步驟:
1)進一步分析當前的數據:從儀表板和ad-hoc查詢,到諸如空間分析和圖形分析或更高級先進的分析。您可以專注于客戶忠誠度、客戶流失率、分析本地情況(如何接近您的客戶),并開始建立社交網絡(與您的客戶建立社交聯系)。這些分析將為您的企業帶來更多的商業價值。
2)建立正確的架構,用于存儲數據的種類和數量:這一切大數據是如何存儲在您的企業的。把這些原始數據直接轉化到數據倉庫中,每兆字節以低成本優化存儲大量低密度數據是十分重要的。這便是Hadoop本身已被證明是非常有效的。Hadoop是開源的,與現有的數據庫兼容。它集合了所有可用的數據,您可以用它來尋找新的關系和新的潛在的商業價值。
3)為數據傳輸速度建立體系結構:一旦您有合適的設備來存儲大量的不同的數據,您就可以開始實時處理數據。例如如果您有數據流從傳感器傳輸而來,存儲在Hadoop,您想看看正在發生的事件,并需要確定是否需要采取行動。您可以使用一切歷史數據,以確定在實時條件下進行預期(預測分析),您可以創建模型反應發生模式。如果您已經建立了一個智能的基礎設施,您將能夠實時響應事件,并進行實時的決策。
4)開始探索新的模式:利用所有可用的數據,您可以在您的數據中發現新的模式。從Hadoop與其他可用的數據匯總數據相匹配。有不同的大數據初創公司開發的工具,在這個平臺上分析,可以幫助您可視化,尋求新的關系。我們的目標是找到您要解決的下一個問題,最大限度地幫助您從數據中獲取商業價值。
正確發展大數據結構可謂是一個挑戰,同時可能成本是相當昂貴的。然而,結果必將物超所值的讓您成功收回投資。