現在到處都在大肆宣傳“大數據”,即博客、社交網站、論壇、金融交易、電子郵件、文件、日志文件和不計其數的其他來源等創建和傳輸的大規模數字信息。互聯網是大數據快速增長的巨大驅動力,它讓企業能夠訪問來自B2B合作伙伴和供應商的門戶網站、競爭對手的網站、政府基于Web的應用程序和消費者交易等的信息。
所有這些數據都極大地改變了企業的運營:幫助企業通過流程優化提高盈利能力,通過基于購買行為的預測分析提高銷量,或者通過預測市場環境變化來節省成本。
大數據=大商機
我們看到很多充足的證據都表明基于數據的決策對企業產生了重大的影響。其中較著名的例子就是關于低預算的Oakland A的棒球隊如何利用數據分析從多年的歷史數據中提取情報信息以加強競爭優勢,最終成為一支冠軍球隊的故事。當然還有很多其他的例子。
船運公司利用交貨時間和交通模式的數據來進行路線優化,金融機構將確定的市場趨勢轉變成可操作的預測數據,讓他們在股票價格上漲之前就購買某只股票來獲得巨大的經濟利益。麻省理工學院斯隆管理學院的教授Erik Brynjolfsson表示,基于數據分析的決策實現的生產率增長,要比任何其他因素高5%到6%。這種生產率增長能夠決定大多數行業的勝負。
大數據不僅僅是大
在現實中,盡管大數據被吹捧得神乎其神,但很多公司對此仍然采取觀望的態度,因為處理大數據存在很高的困難度和復雜性。根據市場研究公司Gartner的預測,到2015年,超過85%的財富五百強企業將無法有效地利用大數據。在關于大數據的討論中經常讓人頭痛的是,要想從大數據獲得巨大的價值,企業需要訪問真正相關的數據,而不能被收集和存儲所有數據的工作所壓倒。需要收集和存儲的數據量非常龐大,只有將來自多個來源和多種格式的數據整合并對數據的快速實時捕捉才可能從中獲取最大價值。
根據Aberdeen研究所2012年1月的大數據報告顯示,在過去三年中,企業管理的獨特數據來源的數量正在不斷增加。據Aberdeen稱,最厲害的公司往往是那些能夠成功地縮小不斷增加的數據來源與分析程序及系統(即他們用于將數據轉化為業務情報的分析程序和系統)之間差距的公司。
專注于相關的數據
現在我們幾乎能夠訪問和整合來自互聯網或者位于你的防火墻背后(例如CRM、產品生命周期管理或者ERP系統)任何來源的數據。根據經濟學人信息部的研究顯示,“數據如此龐大,并且還在迅速增加,這讓企業很難跟上數據的步伐,企業收集數據的能力和從數據獲取情報的能力之間存在差距。”31%的受訪者“承認他們沒有適當的數據管理系統,但他們都不愿意停止收集數據”。
不要陷入數據漩渦之中,企業在開始大數據項目時應該采取漸進的易于管理的步驟。首先,應該清楚列明你的大數據計劃的目標。需要哪些數據,為什么以及誰能夠使用這些數據。考慮清楚你試圖從這些數據中獲取什么類型的情報或者出于什么目的:增強你的競爭力、通過供應鏈和采購優化來增加銷量,或者通過趨勢分析和預測分析來增加收入。這也將影響需要的數據集。選擇需要的數據往往是一個挑戰,不過企業應該從確定幾個指標開始,這將對未來的數據分析有著重大的影響。只要專注于提供最有價值的數據,無論是位于防火墻內部還是外部的數據。
例如,每天發送的2.5億tweet等于8TB數據,而只有1000個tweet與你的企業或者產品品牌相關。所以你不需要每天對這8TB數據進行存儲和分析。從數據中提取情報在更大程度上取決于數據的質量和相關性,而不是數據的數量。
實時訪問和相關性
與你企業相關的數據可能是無限量的不斷增長的數據,這些包括來自社交網站feed、評論網站和新聞來源、你的云應用程序以及政府基于web的應用程序、供應商和競爭對手的網站等的數據。大部分這些數據都難以訪問,并且他們包含的數據總在不斷變化。
你將需要訪問各種各樣數據的能力,以及實時訪問的能力。通過實時整合平臺,你可以靈活地定義和更新你需要的數據來源,以及訪問你可以通過網站看到的任何數據。你只需要輕松地轉換數據、對數據執行操作,并自動產生一個結果。
想象這樣一個場景:你可以確定買家的習慣和購買模式,并通過增加吸引特定消費群的產品和產品類別來增加銷量。或者從博客、論壇和社交媒體評論來預測股價。
如果你能夠自動訪問任何應用程序或者基于web的數據來源,加載這些數據到另一個應用程序、數據庫或者你選擇的其他數據存儲,大數據計劃將會對你的業務增長產生重大的影響。
付諸行動
只有最終付諸了行動,大數據才發揮了其價值。不論你的數據集有多么大,關鍵在于從這些數據中提取情報,然后能夠根據提供的情報來采取行動。因此,能夠訪問相關數據(不論其來源是什么)是任何數據挖掘工作的關鍵。例如,如果Oakland A只是監測和分析趨勢,而不采取行動的話,他們將不能最終成為一支冠軍隊伍。
對于那些能夠戰略性地利用大數據的企業,他們的創新能力、業務靈活性和利潤都將得到極大的提高。不要被大數據的數量嚇倒了,從專注于相關數據來開始你的大數據計劃,而無論數據來源、數據類型或者格式,你將很快獲得有意義的情報信息,然后再采取行動。