錢伯斯是IBM公司分析解決方案事業部副總裁。她表示,許多客戶夠買了大數據和預測分析的服務,但卻希望其實現他們已經適應了的老的商業智能工具和數據庫工具。
“通常情況下,客戶做的往往就是依靠他們已經知道的東西。”錢伯斯在2012年Hadoop峰會上說。“他們希望利用他們現有的基礎設施、使用現有的數據和工具。他們不想有任何的不同和改變。所以我告訴我的客戶說,如果你不執行不同的操作的話,你不會得到任何不同的結果。”
新的方法,技術和工具需求
錢伯斯是完全正確的,如下從三個方面分析了原因:
1、基礎設施。處理和存儲大量、多結構化數據集的新方法不斷涌現,正是因為傳統的關系型技術不能夠在單位時間內完成工作或者不具備成本效益。例如,Hadoop允許你在合理的時間內運行開放源碼軟件以非常低廉的價格存儲和處理大數據規模。現在,嘗試利用甲骨文的服務。可以節省300萬美元的費用,以及6個月的時間。
2、數據。大數據是豐富現有的內部交易數據與其他不同來源的數據,這些來源是來自您的企業之外。這可能意味著這些數據是來自Twitter或Facebook這樣的社交媒體、或來自國家氣象局、教育部門的公共部門的數據、來自彭博、道瓊斯的市場數據。如果你沒有混搭數據,你可能不必要進行大數據分析。
3、工具。因為它們必須在新的,更大,更多樣化的數據量并行計算基礎設施之上,大多數最傳統的商業智能工具不會削減。你需要的是現代化的數據可視化和分析平臺,使用戶能夠輕松地處理大數據可視化。為了公平起見,極少數現有的商務智能供應商,如Tableau和MicroStrategy正在努力讓自己的產品更好地融入大數據。但是,總的來說,你在過去的十年左右已經使用的舊的報告工具無法為當前的大數據提供足夠的可操作的見解。
風險的博弈
但據我所知,這種改變是很難的,所以有時IT部門是為了規避風險。但是,我們正處在一個十字路口。大數據絕不是曇花一現或輕微更好方式的商業智能。這是一個全新的模式,需要思維的重大轉變。換句話說,“你已經在經歷一些額外的風險了。”按照錢伯斯所說的那樣,實現大數據的成功。
她說,這意味著“如果你想有更多的見解,你一定要注入您的應用程序,你的數據網新信息。”這意味著你必須投資新的基礎設施技術等,諸如Hadoop和其他平臺上,形成一個新的大數據分析的基礎。你需要采用新的最終用戶工具,把所有的大數據轉換成易于理解的見解。
好消息是,你不必將您的整個現有的基礎設施和工具集推倒重來。事實上,我強烈反對那樣做。你現在所使用的商業智能和數據倉庫有可能是一個原因,因為他們已經在為您提供相應的業務價值。事實上,許多大數據技術確實能幫助你從現有的數據庫和工具獲得更多的價值。
當涉及到大的數據,從小事做起。確定一個特定的需要解決的業務問題,一個固定的業務才能帶來實實在在的利益。與大數據行業的同行們交流學習。