正當你認為大數據無法變得更大時,它依舊變得更大。不管它的實際大小,大數據正顯示出它的價值。各種組織都有各種形式和大小的大數據。他們認識到了重要性、機遇,甚至關注的必要性。這已經變得很明確,大數據將使那些忽視它的人過得不舒服。
那些已經馴服大數據的組織 –他們自己知道它的價值之前進行的多結構化海量存儲 –正在提高其運營效率,不斷增加自己的收入,并產生新的商業模式。
他們是怎么做到的呢?他們的技術成功可以歸納為以下秘訣。
1.通過短期思考進行長遠考慮
并不是只有你一個人擔心當前大數據技術。一切都發展如此之快,以至于我們不可能知道哪些工具,平臺和方法將是今年或明年最好的。
放松。這種快速的發展可以為你所用。
每年,供應商使用大數據將會變得越來越熟悉。無論是內部部署還是在云中運行,關系和網上交易系統(OLTP)將變得更有效率,更智能。技術的發展將緩解Hadoop和數據倉庫之間的關系。并且產品進入市場,總是會更加準確的的滿足您的特定需求。
因此,保持放松。對新產品的可能性保持開放,只要它們提供足夠的價值來證明把它們集成到現有環境中。保持商業智能平臺,這種平臺會直接連接到各種各樣的格式。你現在要為市場能提供的一切做好準備。
2.看穿了錯誤的選擇
Hadoop或者數據倉庫,這將您的組織需要的嗎?啊,但是這是一個有趣的問題。和Hadoop的數據倉庫不但可以很好地一起工作,組織實際上會受益于他們的合作。
數據倉庫是最適合緊縮你的重要的結構化數據,并存儲它,BI工具和儀表板可以很容易地找到它。但是對于一些分析處理和某些類型的轉變,它的能力和速度是不足的。
Hadoop可以做到這一點。此外,雖然Hadoop在交互查詢和數據管理方面不強,但是它擅長于處理非結構化的,復雜的數據。
它們共同構成一種共生關系。想象一下,例如,管理人員用這些數據來來預測明年的庫存需要。該數據集可能是巨大的,并且幾乎沒有時間去模擬它,調整它,或準備把它給數據倉庫準備好。當高管們要處理它時,也許一周之內他們就要搞定。這就是什么時候Hadoop會升級,以存儲和細化數據并把樣本發送到數據倉庫中。
“大數據是不能代替數據倉庫的,”Third Nature的CEO馬克 馬德森在他的文章“大數據是關于什么的。”中寫道,“它也不是需要單獨維護一個孤島。這是新的IT環境的一部分。”
不要落入非Hadoop即數據倉庫的陷阱。你可以而且應該同時使用它們。
3.平視大數據
當你思考大數據的時候,你應該平視它。Aberdeen Group的2013年報告發現,“使用可視化搜索工具的組織中,48%的BI用戶都能夠在沒有IT人員幫助的情形下找到他們需要信息”沒有可視化,這一比率會下降到只有23% 。
此外,根據這項研究可以發現,管理人員使用可視化數據發現比同行沒有可視化的數據發現及時信息的可能性高出28%。
當涉及到大數據,也許最重要的是,該報告發現,可視化還利于和數據進行互動。管理人員使用可視化數據是他們的同行和數據進行互動的兩倍(33%對15%)。他們也可能一時興起詢問問題,這些問題往往是由之前產生了片刻的見解啟發的問題。
探索數據可視化讓數據的故事以大腦可以一瞬間抓住的方式生動地展現出來。 “一個燈泡熄滅,”富國銀行戰略規劃副總裁達納朱伯說:“你只是沒有用電子表格達到那個水平。”
可視化分析可以讓你在任何時候做兩件事情:
1.改變你這個在觀察的數據 –因為不同的問題,往往需要不同的數據。
2.改變你看待它的方式 –因為每個視圖可以回答不同的問題。
通過這些簡單的步驟,你進入所謂的可視化分析的循環:你得到數據,查看數據,問及并回答問題,并重復。每一次,您的詢問將加深您的見解。您可以向下鉆取,向上追溯,或橫跨鉆探。您可能會帶來新的數據。當可視化加速擴展你的思維的時候,你可以創建視圖后視圖。