讓我們突破管理數量之龐大這一點,考察一下大數據基礎設施方面仍存在著某些不足,其是否是基于Hadoop的、或者是基于ADBMS,又或者是兩者的組合。企業尋求最大限度地提高大數據的商業價值必須有效地解決這些問題。
如下三個建議,幫助您的企業最大限度地提高大數據的商業價值:
第一、縮小商業用戶和大數據之間存在的差距
目前的實現需要許多相同的組件,傳統數據倉庫/商務智能(DW/BI)系統,包括建立必要的數據模式和SQL查詢。這些通常是不能直接訪問的大規模并行處理(產量)的分布式文件系統,如Hadoop,路線數據批處理模式。連同正常的延時與數據倉庫相關的,這可能會導致影響實時決策的盲點。
第二、在同一時間管理多個源
數據管理系統通常在同一時間管理一個來源的數據。因此,復雜關系數據類型之間往往錯過。信息管理和分析隔離作為一種(非常大的)倉可以產生只有一個子集,并存在潛在產生的問題多于答案的可能。一個完整的信息圖片將結合企業其他相關記錄的大數據實現。企業必須重新考慮他們的孤立大數據,重構他們獲取和分析與解決問題所使用的分析方法,以便可以讓統一的數據通過。
第三、發展語境業務
非結構化內容,如文檔、電子郵件、網頁內容、流暢的文字、SharePoint,通話記錄和調查,既不分類也不進行分析,結合上下文理解。大多數大型數據系統斷言他們“處理”的數據是非結構化的,但他們不執行文本分析或真正結合語境進行非結構化的內容分析。語境業務的理解,有助于發現新的商業洞察力,必須開發。
審查現有的大型數據基礎設施的這些問題證實了企業所面臨的挑戰遠遠超出IT領導人們的理解和想象。使用上述的技巧,而不只是管理大數據作為自己單獨的筒倉,可以幫助您獲得新的見解和系統數據。