3月10日,起點學院特邀 GrowingIO 創始人 ,前 LinkedIn 美國商業分析部高級總監 @ 張溪夢做客免費在線講座「起點學院公開課」欄目,分享通過 6 個步驟,教大家學會數據驅動產品優化的秘訣 。本文由人人都是產品經理團隊@ 張婷依據嘉賓現場分享內容整理,編輯有修改。
一、什么是數據?
數據有四個屬性:時間、地點、人物和事件;舉個例子,在電子商務這個環境里,假設分析一個交易數據。這個交易數據在時間上,它必須有一個時間戳,這個數據必然會在某一個地點發生,還有對應的交易者,在事件的級別,消費者要購買某種產品,花某種價格,通過某種支付手段,進行交易。所以說,這是一個事件。真正的用戶的行為,往往都是以事件為核心的數據點。這些數據點,會造成一個整體的事件流。
二、數據的幾何級數增長
舉幾個例子,像 LinkedIn 這家公司每天大約會產生 100 億條事件;通過用戶行為產生的事件,在不到 5年 的時間之內,咱們全球大約會有 40 億的人每天會產生大量的數據,同時,它是一個 4 萬億級別的市場;在全球范圍內,將近有 2500 萬個 app 誕生,不但有針對普通用戶的 app,還有對企業級服務的 app;另外會有將近 250 億活躍用戶的各種設備將會接入我們的網絡;最后,每年將近產生 5 萬億 GB 的數據。
三、什么是數據分析
1、數據分析的基本概念
數據量這么大,呈爆發式增長,它的價值曲線,數據量,數據設備數,人的關聯度不斷增加,但這并不表示數據本身能夠帶來價值,真正的商業分析的核心,是通過 5 個步驟不斷把低價值的信息或者數據變成高價值的產出。一般數據分析可以分成 5 個步驟。
了解以前發生了什么;
分析為什么會發生這件事;
觀測目前正在發生什么事;
預測未來將會發生什么;
全局優化。
前四步是數據分析中的基礎步驟,包括數據預測,它本身并不能產生太大的價值,只有通過全局優化,才能產生有價值的產出。
2、數據分析的發展歷程
對于產品經理來講, 數據可以作為產品優化的依據,比如交互、留存。實際這一切都是基于對數據基礎的理解,在過去的 5年,數據框架在技術的推動下,有幾次主要的迭代時期:
第一個時期:數據庫和數據倉庫的時期。傳統的公司都使用數據庫或者數據倉庫來存儲數據,他們應用一些數據庫管理工具獲取數據,再通過一些經典的 BI 軟件,比如 Cognos 或者 Businessobject 進行數據可視化,形成報表發給管理層。一般對于這些數據,只有管理層決策層才使用。這個階段發展了將近 15--20年。
第二個是我們現在所處的階段,至少在過去的五年,數據量呈爆發式增長。數據研究者開發出了一套分布式的技術,這套技術以 Google 和 Yahoo 為代表----Google table 和 Yahoo 的 Hadoop,它能處理大量的半結構化數據,然后通過分布式的方法,能并行地計算處理很多信息。
Google 和 Yahoo 的辦法增加了數據處理的容量,大大降低了數據庫的成本,分布式技術將數據庫的技術提升了一個層次。以往數據分析只能支持幾十個人的決策,現在能夠支持幾千甚至上萬人的決策。它使得數據分析從一個非常貴的、緩慢的流程變成了一個有效的、價格相對較低的層次。
但這其中還有一個問題:以往的軟件都是比較結構化的,很多人都可以使用。但是 Hadoop 這種大數據結構,很多人都很難用,這就造成很多技術性瓶頸。具體體現在:
數據收集來源增加,文件收集復雜性提高。
對工程能力操作感各個公司拆解很大。
3、數據分析驅動產品設計的意義
如果能夠用好數據分析公司,會產生一種戰略性優勢。用不好數據分析的公司,在發展上則會產生很多瓶頸。
在現在的美國和將來的中國,要想做好一個產品經理、設計師、產品運營人員。核心不再是依靠分析師來分析數據,而是能夠熟練地應用各種企業級應用,來達成數據驅動產品的手段。
如何利用數據驅動產品設計?
必須要有數據驅動產品設計的意識,這個意識已經被美國的 Facebook、LinkedIn 證明;
善于觀察用戶的行為,用戶的行為是不會說謊的,用戶的行為往往能夠反映出用戶對于產品的容忍度和熟練度;
我們要很聰明的用技術做決策;
今天的企業已經由流量型向用戶體驗和產品設計方向迅速進化和衍化。這種進化和衍化的結果就是:每一個企業,不論大小,都需要用精益化運營的思維做好產品。
互聯網已經從 web2.0 進化到 web3.0,意味著流量為王的時代已經結束;這樣的形態下,企業往往不注重流量的轉化,而在乎流量獲取的速度。而在今天這個時代,一個企業如何能夠在一定時間內快速地對用戶進行轉化,增加用戶的體驗,增加用戶的留存,這是當代互聯網產品的核心。
四、如何通過數據分析驅動產品設計
精益化運營
精益化運營不得不提的三個指標---轉化率、用戶的活躍度、用戶留存率。這三點組成了一個產品最基本的一個骨架。
以往我們談論的都是流量:你有多少用戶,多少活躍度,僅此而已。但今天來說,那些粗淺的指標已經不足以衡量產品的優秀。一個好的產品,我們首先要關注的是用戶的留存率和用戶粘度。在傳統互聯網企業,用戶的留存率和粘度一般是后期才會關注的;但是在今天,在產品設計的早期,我們就需要關注這個指標。這個指標可以細化成 5 個不同的點:
能夠通過非常簡單的方法讓用戶知道這個產品的價值;
產品使用的流暢度。今天產品設計的思路已經演變為流式的設計,一步步引導用戶如何使用你的產品,降低用戶的使用門檻很重要;
產品的區隔。這也是精益化運營的思維。不知道大家在平時做產品的時候有沒有考慮到用戶是可以分成不同的屬性,同樣的產品,針對不同的用戶應該有不同的功能點,不同的體現,這就要求產品經理和運營人員花足夠多的時間去了解這些不同的用戶對產品交互的不同的需求,喜歡什么,不喜歡什么;
要分析用戶的行為。用戶的行為是產品經理了解用戶最好的方法,用戶行為的分析往往能代表最真的用戶需求;
結合前邊五點的分析,對產品進行改造。
Facebook 提倡一句話:Move fast and break things。它講的是一種黑客的文化——快速迭代??梢苑稿e,但要快速迭代;持續迭代,小范圍改進;最后會產生幾何級數的變化。
傳統的方法,則是建立一個較長的項目周期。這樣來做的話會有幾點風險。
實施周期長;
迭代速度慢;
成本高;
不能在短期之內理解用戶需求。
所以在過去幾年,硅谷提倡 MVP(這個概念在《精益創業》中有提到)。一個核心的概念是:產品設計者如何能夠產生一個最小的產品,迅速把它推向市場或用戶;測試完之后衡量產品的數據,通過數據來驗證假設,進一步完善產品;再進入下一個迭代的循環。
精益創業概念的核心,并不只適用于創業公司,其實在很多公司都有體現。比如 Facebook,就應用了這種概念,對產品進行小范圍體驗,數據分析,然后迅速迭代。
產品各階段關注指標
在普通的傳統的公司,當我們做數據分析時,很多人用 PV、轉化率來衡量產品的好壞,而用數據驅動則會用更全面的數據來衡量產品。
如何用數據衡量一個產品呢:
首先,它應該有一定的認知度,否則就不會有用戶知道。SOV、PPC、CPM 這些詞都是顯示廣告投放的;
其次,需要衡量用戶的增長。這種增長的指標在美國已發展成為一種學科,有多少新增用戶,你的漏斗模型是怎樣的,你的霍克模型是怎么樣的,這個用戶的存留區間是怎么樣的;
第三,用戶活躍度。衡量每月,每天的活躍度,以及有多少獨立訪客
第四,衡量如何賺錢。比如電子商務網站,衡量的是 GMV---整個交易額,ASP---每個商品的平均價格, LTV---生命周期價值;這些 KPI 對產品分析是一個整體性的東西
一個產品,我們必須全面衡量。產品經理需要有這種直覺——不能用一個指標來衡量產品,而是要用多個指標來衡量。
比如,9年 前,我剛加入 eBay,要衡量 150 個指標,每天發送一份報告,這份報告大概有 20-30 個指標,來衡量業務的發展。這些指標的增長或者降低都是由業務戰略的決策造成的。如果每分鐘見證指標 0.1 的變化,對當時的 eBay 來講,將是一個 5000 萬金額的變化。
好的產品經理不能只看產品的 KPI,需要通過市場、運營、產品設計的角度以及最后銷售的角度來衡量。
比如 LinkedIn,每天關注的是 50-60 個核心指標,公司 CEO 早晨起來的第一件事,就是要看這些 Report。在線營業額增加了 65%,是由于哪條產品線上的哪個功能引起的,為什么會帶來這些變化,這些為什么會分解到每個產品線?產品經理會對此進行細化,找出原因,進而優化產品。
數據分析需關注指標以及指標拆解
首先,我們核心要關注的指標往往不是 150 個指標,或者 500 個指標,我們重點關注的指標往往不超過三個指標,這三個指標根據不同的業務線會有很大的差別。這三個指標有:
用戶留存(用戶活躍度)----最核心的指標;LinkedIn 會衡量月活躍用戶和日活躍用戶。一般會把 MAU 分成三個檔次------明天或下星期或下個月或今年我對用戶的增長預期是什么,這是一個中位數。然后,還會做一個高點和低限,就是按照我們的預期,這個增長最高不會超過這個水平面,最低也不會低于這個水平面。這樣,我們把 KPI 分解成了四個不同的 KPI 值----平均值、高值、低限、還有實際值。這樣來說,實際值如果高于高點或者低于低限,對于業務運營來說,都是一個很大的問號;
再舉個例子,比如我把月度活躍用戶進一步進行分解,分解成:新注冊用戶、既有用戶今天重新回來的用戶、以往用戶今天開始不使用的用戶、上周新來用戶這周不使用的用戶。把月活躍用戶分解成了新接入用戶,持續活躍用戶,以往活躍今天不活躍,剛剛新增用戶就開始不活躍用戶。為什么將這四個指標分解成這四個指標,因為這四個指標可以和產品關聯起來。比如拉新,如何有拉新的手段;第二,如何促進用戶的活躍。第三,已經流失的用戶,如何減低它的流失,第四,新增的用戶如何減少流失。這個數字相加,就是每月的活躍用戶。這四個指標是可以采取行動的指標。
再比如,LinkedIn 新增的用戶,來源的渠道是不一樣的,活躍的用戶,流失的用戶,是我們需要持續關注的,因為它不斷地把我們新增的用戶活躍度減低,因此我們要盡量減低流失率。新用戶的流失,在一個產品里面,非常忠誠的用戶流失的可能性比新增用戶流失的可能性低很多。但是如果我們的忠誠用戶在迅速流失,那么說明我們這個平臺上的用戶的粘性有很大的問題。但是新增用戶的流失,可以用培訓的方法,引導用戶的方法,促進它的活躍度。這樣,就把一個宏觀的指標,分解成了更細化的指標。另外一點,分解指標的好處是,我們分解能產生增長或者衰竭的原因。比如下邊這張圖,
我們可以看到每條線,變化是不一樣的。最后的增長就知道它的成因。
一個活躍用戶,或者流失用戶,可以進一步對它進行分解。這種方法就是通過維度的分解。舉個最簡單的例子,比如說我把用戶的流失率,用男性和女性的方法拆解開來,比如上圖中,綠色是男性,紅色是女性,大家可以看到,綠色的活躍度是高的,說明平臺比較適合男性用戶,女性用戶偏少。如果我們想刺激活躍的話,可以針對這兩種不同的人群采取不同的方法。
再講一個分解核心 KPI 指標的方法,咱們講一個促活的例子。比如說,用戶很少用一個平臺的產品,我們發現,當把這個指標進行拆解的時候,假設上圖中橘黃色的這條線是 IOS 用戶,藍色的線是安卓用戶,綠色線是 PC 用戶,大家來看,我們把一個重新激活的用戶分成了三個組,可以看見,IOS 用戶在不斷增長,它的活躍度是在不斷增加的, 安卓用戶表示的線比較平緩,PC 線相對來說是衰減趨勢的,這樣來說,在哪個平臺上,你的用戶是十分活躍的。
AARRR 以及產品指標拆解案例
在美國有一個概念---AARRR。A---獲取用戶,A---激活用戶,R---用戶的留存,R---用戶產生多少價值。R----用戶與用戶之間的推薦。用戶之間的推薦,是最好的獲取客戶的方法。對這個指標進一步進行分解,比如說在 LinkedIn 上的推薦,它是通過下面幾種方法來實現的:
通過你可能認識的人來把 LinkedIn 推薦給一個用戶;
通過上傳地址錄來推薦給別人;
通過電子郵件來做產品的推薦;
當我們做了這樣的一個渠道的分類之后,我們發現,在產品上的模塊---您可能認識的人,產生了最多的推薦用戶數量。這對于產品運營人員來說,可以進行各種優化。
給大家舉個實例,在最早的時候,LinkedIn 研究如何使用戶爆發式的增長,他們發現從首頁上登錄的用戶活躍度和忠誠度比從 EMAIL 地址邀請來的用戶的活躍度高的多。當時的產品經理做了一種嘗試:大范圍優化從網站上來的用戶。怎么做呢,就是對每個人的簡歷進行優化,優化之后,使它更方便 SEO 爬蟲的搜索,這樣一來,從網站上獲取的用戶就遠遠大于從郵件獲取的用戶。它的核心的方法論是這樣:
我要增長核心用戶;
通過分析用戶的來源,找到了那些不斷增長的活躍用戶大部分來源于網頁,而不是從電子郵件來的;
迅速做一個產品嘗試----優化每個人的簡歷,增加 SEO 的曝光率。
這次改變以后,為當時的 LinkedIn 增加了 50%的擴張速度。這次成功嘗試背后的一套核心觀點是:如何用數據驗證它的這種假設,或者迅速驗證這種業務的判斷。就是那么一個簡單的例子,帶著一個假設去做一個產品的改動,改動之后再用數據證明自己的改動是有效率的。如果這個改動是沒有效率的,那么需要立刻停止這個改動。
再舉個例子,也是今天我認為產品分析驅動產品設計最核心的指標----用戶的留存度。一個好的產品,是能夠讓很多用戶在你的平臺上產生價值的,用戶必然會花更多的時間會有更高的粘度。這是今天衡量一個產品最核心的一個指標。
這張圖,是一個衡量隔日留存率的圖,就是隔天有多少用戶在使用。這張圖為什么很重要呢?因為在很多產品里邊有一些魔術數字,很多人都嘗試著在產品中找到這個魔術數字,這個魔術數字往往是從這張圖里迭代出來的。比如說我的產品利用某個功能的隔日留存,還不到 10%,利用另外一個功能的隔日留存變成了 30%,不用某個功能的用戶的隔日留存是 10%,用這個功能的用戶的隔日留存提到了 30%。這個告訴了我們什么?
我們的產品里邊,用戶是有區隔的,不同群組的用戶在用不同的功能
用某種功能的用戶,對我們的平臺或產品有很高的粘度和依賴度。這個提醒我們,要增加這種有高粘度的產品功能點,讓大量的用戶能夠用這個功能點,潛在的或者間接的就會增加用戶的留存度。
總結一下:
通過留存圖找到不同用戶的群組在留存率上的區別。比如用功能 A 和用功能 B 的用戶在留存上是有區別的,那么我們就要專注打那個功能點,讓更多的用戶來使用這個產品 FEATURE。
聽起來很直接很傻的方法,但是被很多公司屢試不爽。LinkedIn 找到了這個魔術數字是:在第一周連續增加 5 個社交網絡鏈接的用戶群,這類用戶的留存度和他們在未來為平臺貢獻的價值,是第一周貢獻少于 5 個社交連接的用戶群的 5 倍以上。
發現這個魔術數字后,當時的產品經理立刻將這個增加鏈接的功能點做到了很多頁面上去:
在首頁的入口大范圍增加了一個功能欄,讓用戶上傳它的地址簿(因為已上傳地址簿,自然會增加用戶連接);
給每一個新登錄用戶推薦和他在一個公司工作的他可能認識的人;
數據分析發現,當用戶要邀請他的好友的時候,需要打字才能邀請。LinkedIn 想能不能不要讓用戶打字,直接推薦給他可能認識的人,這個功能點再一次增加了第一周之內登錄用戶增加社交連接的可能性。
大家看,通過那一個點找到了 magic number,然后產品經理通過各種不同的產品設計來促進這個魔術數字的發生,就產生了未來 LinkedIn 病毒式的增長。這種病毒式增長,就是成長黑客最核心的一個概念:如何用最快的最低的成本驅動最小的產品改動,通過數據驅動的方法來大規模獲取客戶。
然后再講講如何用數據驅動用戶體驗:
首先,我們必須要能分析今天的數據,這是所有做最小化產品,精益運營的最核心的一個概念。至少我們能夠看到我們的產品有多少人在使用,如果沒有數據的話,是無法證明自己腦子里的假設。
第二,最重要的一點,我們要找到最關鍵的問題進行思考,比如 LinkedIn 對產品做的這些改進,通過數據分析的方法找到了問題:
從電子郵件邀請來的用戶活躍程度低;
我們發現第一周登錄增加了五個社交關系的人活躍度高,不增加的人活躍度低。找到了這個差異點,就要思考如何強力的推動某種改變。
在產品的早期,沒有公司有能力做 A/B 測試,往往是做很小范圍的改動,隨時看數據的變化,這就足夠了。實驗完了之后,又回到了數據上面,得到了分析結果,要記得看數據,最后,其實數據驅動是很簡單的事,它只要求我們:
有信念;
要有一套非?;A的數據分析系統;
需要創新的精神,能夠很迅速的進行產品迭代。