上個月公布的一項調查結果顯示,由Apache基金會所開發的分布式系統基礎架構Hadoop可能即將面臨著來自資金鏈方面的壓力與挑戰。具體而言,調查中的絕大多數受訪者都表示目前沒有對Hadoop的投資計劃,主要原因是認為Hadoop“……可能在其商業價值轉化與功能實現上面臨相當大的挑戰”。
作為研究大數據的主要工具,Hadoop暴露出的資金鏈風險可能昭示著整個大數據領域的資金問題。尋找到能夠實現精準分析能力的資源在業界一直是一項巨大的挑戰,與此同時它也是新一代商業友好型大數據工具研發的目標,而獲取商業價值,則是一個更基本的問題。
對于許多人們津津樂道的大數據企業或組織來說,通過大數據獲取商業價值似乎總是如此容易:有了大數據,我們就能更深入地了解客戶的行為,并運用這些知識來增加客戶的滿意度,從而提高企業的盈利能力。但說的容易做起來難,真正去讓一個新興企業來實現大數據價值時,一切往往變得捉襟見肘,但不管怎么說,回顧總結一些當下實用的大數據商業實踐方法總歸沒錯。實際上,最大化大數據的商業價值可以歸結為將下述的六件事做好:
1.以商業思維為出發點:對于數據科學家們來說,運用Hadoop或其他先進的大數據分析工具暢游于數據知識的海洋中是在愉快不過的事了,不過如果不把分析的結果轉化為可以應用于解決現實世界商業問題的東西,那么對于時間和資源則是巨大的浪費。與業務專家合作,了解改進過程中的機遇與挑戰,將會是一個大數據項目成功與否的關鍵。專注于一個具體的商業問題將有助于識別有用的數據集,并針對化選擇適合的技術與工具。與此同時,這樣的過程能夠促使你步步為營,對項目進行進一步推進。
2.把目光投向將理論付諸實踐的途徑上:要實現真正的商業價值,我們必須對理論分析的結果進行實際的運用。這聽起來毫無疑問,但事實上有太多的大數據項目都會因為走不過這一關而從此塵封,將理論分析的結果納入商業活動并使它們因此收益往往并非易事。有時,在實驗室里看起來很美好的數據有可能是不可用的;而當你在商業活動中真正需要某項數據時,它也有可能變得過于昂貴。與此同時,一系列的行業法規也對數據的可用性產生巨大的影響。
3.使用最前沿的分析方法:商業智能與商業分析方法的創新正在改變企業從用戶數據中獲取價值的方式。新興的數據分析平臺也因此不再是像傳統的描述性報告或歷史記錄儀表盤那樣的周期性呈現,轉而成為了一個能夠不斷分析傳入的數據,提供指導意見,并且實時可操作的龐大系統。大數據的工具與基礎設施使得當今的數據分析能夠更加快捷簡便地對機器學習方法進行應用,從而對包括各種各樣結構化與非結構化數據類型的巨大數據集進行探索。
4.擁抱多樣化的分析工具:R, Python, Hive, Groovy, Scala, MATLAB, SQL, SAS;哪個才是你的最愛?這個技術創新呈爆炸性發展的世界帶給我們的副作用之一,便是常常需要學習一套新的分析工具。等著你最拿手的分析工具自己升級往往不是一個好的選項,領先的分析團隊將不可避免地需要使用多個工具來支持他們的業務需求,所以最好的方法是去擁抱這樣的多樣性,構建一個靈活多樣的技能儲備,用于實現由不同工具構建的各種分析模型。在一個機械化生產的環境中,將多種類型的分析模型整合到一起往往十分困難。然而,已經有諸如FICO 決策管理平臺這樣的現代決策管理系統,通過可擴展包以及網絡服務標準等渠道實現了對上述方案的簡化。
5.利用云端和各類生產力平臺:當今時代,進行大數據分析已經不再需要對昂貴的基礎設施和特別的專業技能進行龐大的投資。通過在云端運行你的分析項目,你可以讓一個專門的第三方處理底層系統和服務,而你專注于手頭的業務問題。同時,你也可以把你所需要的能力和服務外包出去,這也許只會是實現項目的總成本中的一小部分。
6.為業務專家們留足操作的余地:這是最后也是最重要的一點。最大的商業價值往往來自于商務專家們一系列可以迅速轉化為差異化戰略的新見解,而它們有時也能顯著提高客戶與股東對你的滿意程度。具有交互性和高度可視化的儀表板或報告可以更好地提供信息,從而幫助業務專家提出更科學有效的商業策略;標準的決策管理組件則可以使專家們更方便迅速地納入新的分析模型,并以此洞察他們的業務規則和相關政策;而模擬和數據可視化則可以更好地探索新的商業模式和策略可能帶來的潛在影響,使它們更容易被理解,從而加快它們的審批進程,使項目最終走向成功。