有人認為大數據只是一個空洞的商業術語,大有概念炒作的嫌疑。 事實上,大數據只是對于不同的人有不同的含義。眾所周知,大數據已經不簡簡單單是數據大的事實了,而最重要的現實是對大數據進行分析,只有通過分析才能獲取很多智能的、深入的、有價值的信息。
那么越來越多的應用涉及到大數據,而這些大數據的屬性,包括數量,速度,多樣性等等都是呈現了大數據不斷增長的復雜性,所以大數據的分析方法在大數據領域就顯得尤為重要,可以說是決定最終信息是否有價值的決定性因素。那么在執行過程中通常會遇到哪些問題,我們該如何應對呢?
放慢腳步 回頭看路
初創公司里的人們仿佛一直在被人念著緊箍咒:“要么快要么死。”他們是如此著急于產品開發,以至于他們常常沒有空想用戶對產品的具體使用細節,產品在哪些場景怎么被使用,產品的哪些部分被使用,以及用戶回頭二次使用產品的原因主要有哪些。而這些問題如果沒有數據難以回答。
你沒有記錄足夠的數據
光給你的團隊看呈現總結出來的數據是沒有用的。如果沒有精確到日乃至小時的變化明細,你無法分析出來數據變化背后看不見的手。如果只是粗放的,斷續的統計,沒有人可以解讀出各種細微因素對于銷售或者用戶使用習慣的影響。
與此同時,數據儲存越來越便宜。同時做大量的分析也不是什么高風險的事情,只要買足夠的空間就不會有系統崩潰的風險。因此,記錄盡可能多的數據總不會是一件壞事。
不要害怕量大。對于初創企業來說,大數據其實還是比較少見的事情。如果正處于初創期的你果真(幸運地)有這樣的困擾,Porterfield(本文)推薦使用一個叫Hadoop的平臺。
及時解答團隊成員的疑惑
許多公司以為他們把數據扔給Mixpanel, Kissmetrics,或者Google Analytics就夠了,但他們常常忽略團隊的哪些成員能真正解讀這些數據的內在含義。你需要經常提醒團隊里面每位成員多去理解這些數據,并更多地基于數據來做決策。否則,產品團隊只會盲目地開發產品,并祈禱能踩中熱點,不管最終成功還是失敗都是一頭霧水。
這就像有天你決定采用市場上常見的病毒營銷手段吸引新用戶。如你所愿,用戶量啪啪啪地上來了。可此時你會遇到新的迷茫:你無法衡量這個營銷手段對老用戶的影響。人們可能被吸引眼球,注冊為新用戶,然后厭倦而不再使用。你可能為吸引了一幫沒有價值的用戶付出了過高的代價。而你的產品團隊可能還在沾沾自喜,認為這個損害產品的營銷手段是成功的。
這種傻錯誤經常發生。而如果你的企業在一開始就建立起人人可自助使用的數據平臺,來解答他們工作中最重要的疑惑,則可以避免上文所說的悲劇。
把數據存放在合適的地方
很多公司把數據發給外包商儲存,然后就當甩手掌柜了。可是常常這些數據到了外包商手里就會變成其他形式,而轉化回來則需要不少工序。這些數據往往是某些宣傳造勢活動時期你的網站或者產品的相關數據。結合日常運營數據來看,你可以挖掘哪些活動促成了用戶轉化。而這樣結合日常運營數據來分析用戶使用歷程的方式是至關重要的。但令人震驚的是,盡管任何時期的所有運營數據都至關重要,許多公司仍不屑于捕獲及記錄他們。約一半以上Porterfield所見過的公司都將日常運營數據與活動數據分開來看。這樣嚴重妨礙了公司正確地理解與決策。
不拘泥于一個系統
任何一個好的數據分析框架在設計之初都必須滿足長期使用的需要。誠然,你總是可以調整你的框架。但數據積累越多,做調整的代價越大。而且常常做出調整后,你需要同時記錄新舊兩套系統來確保數據不會丟失。
因此,我們最好能在第一天就把框架設計好。其中一個簡單粗暴有效地方法就是所有能獲取的數據放在同一個可延展的平臺。不需要浪費時間選擇一個最優解決方法,只要確認這個平臺可以裝得下所有將來可能用到的數據,且跨平臺也能跑起來就行了。一般來說這樣的原始平臺能至少支撐一到兩年。
不過度總結
這個問題對于擁有大數據分析團隊的公司來說更常見。試想一下,有多少公司只是記錄平均每分鐘多少銷售額,而不是具體每一分鐘銷售了多少金額?在過去由于運算能力有限,我們只能把海量數據總結成幾個點來看。但在當下,這些運算量根本不是問題,所有人都可以把運營數據精確到分鐘來記錄。而這些精確的記錄可以告訴你海量的信息,比如為什么轉化率在上升或者下降。
人們常常自我陶醉于做出了幾張漂亮的圖標或者PPT。這些總結性的表達看上去很令人振奮,但我們不應該基于這些膚淺的總結來做決策,因為這些漂亮的總結性陳述并不能真正反映問題的實質。
相反,我們更應該關注極端值