什么是"大數據"?直白的解釋就是:通過一定的技術在合理的時間獲取到海量數據并且加以分析,然后用這個分析結果去做各種研究、決策等等。關于大數據筆者認為首先必須先弄清楚三個重點。
數據的規模一定要"大"
數據規模越大,分析結果的精確度就越高,千萬億、甚至百億億字節量級的數據所能分析出的結果相對精準。但如果數據不夠大,很多數據挖掘和預測工作就沒有辦法進行。簡單舉例,長期跟蹤一個用戶在互聯網上的瀏覽習慣和各種操作,就可以對他進行非常精準的預測,但如果僅僅只有一兩次的數據這種預測就不會太精準。
"大"不僅指規模,還包括價值
數據的價值首先在于研究價值,其次在于商業價值。僅數量上的堆砌體現不出這些價值,而需要很強的關聯性、結構性。關聯性是指,比如淘寶如果只記錄一個交易的買家、賣家、成交物品、價格等信息,商業價值就很有限。但如果記錄了買賣雙方的溝通和社交關系,購買前后的其他行為,那這個數據將非常有價值。結構性在于,比如一種數據記錄地球上每棵大樹每年長高的程度,這簡單堆砌的數據價值有限。但如果數據變成記錄每棵大樹的位置、氣候條件、樹種、樹齡、周邊動植物生態、每年長高的高度,那么這個數據由于具有了結構性就大大增加價值。
"大數據"最終價值體現在對其分析和使用上
如何使用大數據的分析結果是關鍵,而不是技術。比如騰訊和阿里巴巴,都有十億左右的用戶,使用其產品進行日常溝通或者購買交易。所以他們了解用戶的所有溝通習慣或交易情況。暢想下如果未來這兩家公司的大數據完成了融合,就可以從不同的維度勾畫出一個完整的人的行為習慣,并預測他未來的發展和動向。再進一步設想,能和人工智能結合,是不是可以有能分析和預測人類行為的機器?大數據用對了潛力無窮,用錯了非常危險。這也是需要深入探討的科學與倫理的問題。
而特別要說明的是,大部分人工作中接觸的都不是真正意義上的"大數據",最多只是"大規模數據",或者連"大規模"這個量級都達不到。但實際操作中,仍然可以建議用一種"類大數據"的分析思想,來協助企業推廣方面的工作。
分析哪些數據?
分析互聯網數據,能看出電子商務的成交量、社交媒體上對品牌的關注轉發評論等,從而衡量公關工作在社交媒體上的效果。分析媒體報道,看看都有哪些媒體在報道企業的品牌和公司,了解公眾的贊揚和批評都在什么方面,幫助化解掉潛在的公關危機。分析廣告投放數據與回饋,使用分析結果作為優化廣告投放的依據。
怎么使用這些數據?
定期監控和分析大數據,并根據分析結果行動起來,比如:在公司微博和微信上及時回復留言,與粉絲互動;一旦發現社交媒體上有關于公司的負面新聞,第一時間與對方聯系,擺正態度解決問題,將一個不滿的客戶轉換成一個滿意的客戶等等。總之不要懼怕撲面而來的大數據,而是要更好的利用大數據為企業服務。