大數據被喻為未來關鍵的戰略性業務資產。這意味著在不久的將來,其他部門的員工也會想知道IT部門對大數據的策略。
該怎么跟他們解釋?可以肯定的是,處理大量數據對于大多數IT部門來說并不是新鮮事,但是分析家表示,大數據不同于數據倉庫、數據挖掘和商業智能分析。
數據正以前所未有的速度和可變性累積起來,并且與過去的數據不同,大多數數據都是非結構化數據和原始數據。博客、社交網絡、機器傳感器和地理位置工具都在產生大量非結構化數據。
“我們產生了大量數據,并且我們一直在收集數據,但這非常有限,沒有人真正知道如何處理這些數據,”Computer Sciences公司的Paul Gustafson表示。
行業觀察家稱,IT站在了這場數據革命的最前線。
Catalina Marketing公司管理著2.5PB客戶忠誠度數據庫,包括來自最大零售連鎖店收集的超過1.9億家美國雜貨店的數據。這些數據用來針對那些使用雜貨店信用卡的美國消費者定制營銷策略,根據消費者的消費記錄來發放優惠劵。為了將企業引領到實時可預測情報時代,Catalina Marketing公司首席信息官Eric Willams和其他行業觀察家表示,技術經理必須發展自己的企業信息化管理架構和文化,以支持對大數據存儲的高級分析。
Gartner公司的分析師Mark Beyer表示,精明的IT領導人應該開始做好準備以迎戰大數據,而不是坐以待斃。
以下是IT團隊需要做的五件事情為迎接大數據新時代做好準備。
盤點你的數據
幾乎每個企業都要面對源源不斷的非結構化數據,來自社交網絡或者來自監視工廠車間的傳感器。但是企業在產生這么大量的數據,并不意味著存在保存每一個字節的業務需要。
Constellation Research分析師Neil Raden指出:“在剛開始面對大數據時,人們會感覺需要了解所有來自網絡日志或傳感器的數據。”
部分原因可能來自于急切地推廣企業計算領域下一件大事的供應商和顧問,Raden表示:“那些致力于大數據研究的人肯定會大肆推廣。”
聰明的IT經歷不會試圖處理所有數據,而是會弄清楚哪些數據與企業相關,哪些不相關。
Raden表示,第一步應該是對數據進行盤點,看看哪些數據是內部創建的數據,哪些是外部數據資源,這樣做將幫助IT部門更好地了解數據情況,并增添對業務的洞察力。
在確定數據范圍的同時,IT應該進行有針對性很強的項目以用來展示結果,而不是大數據項目,“你不需要花幾百萬美元來啟動一個項目來看看它是否值得投資,”Raden表示。
讓業務需求說話
很多最初的大數據項目是在IT以外的領域開始的,例如,營銷部門一直利用媒體流來更好地了解客戶需求和購買趨勢。
從業務方面來看,特定領域的專家可能會看到大數據賺錢的機會,但IT需要負責數據共享和數據聯合概念----大數據戰略的重要組成部分。
PricewaterhouseCoopers公司主要信息管理行業分析師Dave Patton表示:“如果大數據戰略沒有與業務目標看齊的話,這很難成功。”
Catalina Marketing公司在制定大數據戰略時,Williams請來了業務經理以及財務規劃和分析(FPA)團隊來共同商討信息架構投資的商業方案。
業務視角能夠判斷新項目能否帶來價值,例如根據購物車中的產品來確定采購項目等,而FPA團隊能夠將提高生產力或者增加銷量等說法進行數字量化。
重新評估基礎設施
Gartner公司的Beyer和其他專家認為,大數據戰略將需要對服務器和存儲架構以及信息管理架構方面進行重大調整,IT經理需要準備擴大他們的系統以迎接不斷擴大的結構化和非結構化數據存儲。
IT團隊需要找出最好的方法,使系統具有可擴展性,并制定路線圖將所有與大數據戰略相關的不同系統整合在一起。
“現在,大多數企業都有不同的孤島系統,用于不同目的,例如客戶管理、營銷等,”IBM公司大數據產品副總裁Anjul Bhambhri表示,“首席信息官需要制定一個戰略將這些分散的孤島系統整合起來,建立一個中央系統。”
熟悉相關技術
大數據領域讓我們認識了一長串新的術語,以及一些首席信息官們可能永遠沒有聽過的技術。
其中,開源工具吸引著大多數人的注目,像Hadoop、MapReduce和NoSQL這些技術就正在幫助Web巨頭(谷歌和Facebook等)處理其大數據存儲。很多這些技術仍然相當不成熟,并且需要操作人員具備特定技能。大數據領域相關的其他重要技術包括數據庫內分析、柱狀數據庫和數據庫倉庫設備。
IT管理人員及其工作人員需要了解這些新工具以確保他們能夠做出正確的大數據決策。
讓員工做好準備
不管企業是需要Hadoop專家還是數據科學家,大多數IT企業最缺的是必要的技術人才來進行下一步大數據策略。分析能力也許是最關鍵的,這也是大多數IT人員存在最大差距的地方。
McKinsey公司預計單在美國,到2018年,將需要14萬到19萬統計方法和數據分析技術方面的專家。
此外,McKinsey公司預計在業務或技術領域將需要150萬經過正規預測分析和統計培訓的數據經理。
對于一些公司,尤其是那些在人口較少地區的公司而言,人員將會是大數據策略最具挑戰性的方面。True Textiles公司首席信息官Rick Cowan表示:“大數據領域絕對需要不同的心態和不同的技能。”
“作為中等規模的企業,讓工作人員能夠順應不斷變化的環境是一個挑戰,”Cowan表示,為了滿足這個需求,他已經開始重新培訓編程人員和數據庫分析師,以讓他們加強分析能力。
Gartner公司Beyer表示,為了在這個全新的新領域脫穎而出,IT部門負責人也需要對他們自己進行一些調整。雖然過去最好的技術領袖都是一半的信息管理員和一半的基礎設施工程師,未來的IT管理人員將是數據科學家和業務流程工程師的結合體。
“首席信息官一直以來都是根據業務部門特定的指示來管理基礎設施,而不是發現機會,然后推動信息的創新使用,”他表示,“這是需要發生轉變的地方。”