曾幾何時(shí),大數(shù)據(jù)這個(gè)詞闖入了互聯(lián)網(wǎng)人群的眼中,并迅速成為了高逼格人群交談必備詞匯。但慢慢大多數(shù)人認(rèn)識(shí)到大數(shù)據(jù)的真實(shí)反饋之后,就不再對(duì)其神秘保持新鮮和艷羨,甚至接地氣務(wù)實(shí)的從業(yè)者從來不拽詞裝高端。
本人今天要說到的是微信大數(shù)據(jù)分析,隨著微信公眾平臺(tái)的崛起和在網(wǎng)紅以及草根營銷者當(dāng)中炙手可熱的發(fā)展,伴隨著微信公眾平臺(tái)衍生出的第三方數(shù)據(jù)監(jiān)測平臺(tái)也應(yīng)運(yùn)而生。由于微信向來是比較封閉的,重視圈子的概念,不像微博的媒體廣泛傳播屬性那么強(qiáng),所以一開始接觸微信的人大多不了解其中的門道,這也就促成了第三方數(shù)據(jù)監(jiān)測平臺(tái)的可依賴性。
因?yàn)榇蠹叶疾欢铮愕臄?shù)據(jù)只要大部分還算合理,不合理的地方有合理的解釋,那么大家都會(huì)買賬,口耳相傳。
在此列舉三個(gè)比較早期,在行業(yè)內(nèi)排名靠前的數(shù)據(jù)監(jiān)測平臺(tái):新媒體排行榜、新媒體指數(shù)、微指數(shù)。最早出現(xiàn)的是新媒體排行榜(以下簡稱新榜),也是最早在公眾號(hào)榜單和文章榜單上確定地位的,那個(gè)時(shí)候還沒有搜狗的微信搜索,而誕生的公眾號(hào)數(shù)量也還比較少,那是一個(gè)你想要關(guān)注一個(gè)高質(zhì)量賬號(hào)卻不知道如何去尋找的年代,不像現(xiàn)在,關(guān)注過度飽和,內(nèi)容過度充斥。
新榜監(jiān)測的公眾號(hào)數(shù)據(jù)僅僅十幾萬(現(xiàn)在樣本數(shù)已超過20萬),但是公眾號(hào)的數(shù)量現(xiàn)在已在兩千萬左右(具體多少我也不清楚,請勿抬杠),樣本數(shù)量其實(shí)是蠻低的,但由于新榜出現(xiàn)較早,且自身監(jiān)測算法也已更新數(shù)次,數(shù)據(jù)慢慢趨向于真實(shí)準(zhǔn)確數(shù)值。
數(shù)據(jù)分析自然需要數(shù)字來衡量和比較,為此新榜發(fā)布了一個(gè)自家的指數(shù)——新榜指數(shù)(New Rank Index,NRI),該指數(shù)是由新媒體排行榜(newrank.cn)基于海量數(shù)據(jù)、用戶深度反饋及專家建議而推出,用于衡量中國移動(dòng)互聯(lián)網(wǎng)渠道新媒體(主要指兩微一端)的傳播能力,此指數(shù)反映該新媒體主體的熱度和發(fā)展趨勢。
新榜指數(shù)是由原始數(shù)據(jù)參照基數(shù)通過計(jì)算公式推導(dǎo)出來的標(biāo)量數(shù)值,用以衡量原始數(shù)據(jù)在其所屬維度的相對(duì)表現(xiàn)。在此需要指出,新榜指數(shù)是為所有賬號(hào)提供了一個(gè)參照系,如果想要不同賬號(hào)之間進(jìn)行比較,那就需要一個(gè)嚴(yán)格的前提——參照系穩(wěn)定。
只有參照系穩(wěn)定,比較才是有意義的。而這個(gè)參照系的穩(wěn)定來源于長期的對(duì)于參照系內(nèi)所有賬號(hào)進(jìn)行觀察和考量,但是樣本數(shù)量20萬的參照系是否具有參照性呢?答案并不是肯定的,那么如何解決這一問題?參考微信官方的數(shù)據(jù)參照系,微信官方的數(shù)據(jù)統(tǒng)計(jì)是基于平臺(tái)所有賬號(hào)(無效賬號(hào)除外)的數(shù)據(jù)分析,這個(gè)數(shù)據(jù)自然是最具有參照標(biāo)準(zhǔn)的,比如公眾號(hào)的閱讀轉(zhuǎn)化率平均在8%-10%,劣質(zhì)賬號(hào)低于此區(qū)間,超優(yōu)質(zhì)賬號(hào)高于此區(qū)間。
這個(gè)區(qū)間值比較重要,后面說到的相關(guān)內(nèi)容還會(huì)用到。
不管你們能不能看得懂,在此先展示一下新榜指數(shù)NRI3.0版本吧,以下數(shù)據(jù)算法解釋來自于新榜:
1、選定指標(biāo)
在微信的計(jì)算中,為兼顧其數(shù)量與質(zhì)量,我們使用總閱讀數(shù)、最高閱讀數(shù)、平均閱讀數(shù)、頭條閱讀數(shù)、總點(diǎn)贊數(shù)五個(gè)指標(biāo)來對(duì)賬號(hào)進(jìn)行評(píng)估,其中:
整體指標(biāo)(總閱讀數(shù),R):指統(tǒng)計(jì)周期內(nèi)所有發(fā)布內(nèi)容的閱讀數(shù)總和;
優(yōu)異指標(biāo)(最高閱讀,Rm):是指統(tǒng)計(jì)周期內(nèi)所有發(fā)布內(nèi)容中的單篇最高閱讀數(shù);
質(zhì)量指標(biāo)(平均閱讀數(shù),Ra ):統(tǒng)計(jì)周期內(nèi)所有發(fā)布內(nèi)容的閱讀數(shù)平均值;
主動(dòng)預(yù)判指標(biāo)(頭條閱讀,Rh ):統(tǒng)計(jì)周期內(nèi)位置為頭條的內(nèi)容的閱讀總數(shù);
互動(dòng)指標(biāo)(總點(diǎn)贊數(shù),Z):統(tǒng)計(jì)周期內(nèi)所有發(fā)布內(nèi)容的點(diǎn)贊數(shù)總和。
2、指標(biāo)標(biāo)準(zhǔn)化
基于不同維度指標(biāo)的差異性,我們首先將所得數(shù)據(jù)標(biāo)準(zhǔn)化,即通過對(duì)各維度原始數(shù)據(jù)與該維度常數(shù)的比值計(jì)算,得到該樣本各項(xiàng)指標(biāo)的千分化數(shù)值。
在新榜指數(shù)中,以天為最小計(jì)算周期,將常規(guī)(1天推送一次,每次最多8篇)的公眾號(hào)為對(duì)象在這一時(shí)間段內(nèi)總閱讀數(shù)、最高閱讀數(shù)、平均閱讀數(shù)、頭條閱讀數(shù)和點(diǎn)贊數(shù)共五個(gè)指標(biāo)的常數(shù)分別記為:
在不同的時(shí)間周期,即日、周、月、年(n=1,7,30,365)下,以上常數(shù)具體數(shù)值為:
在此基礎(chǔ)上,各指標(biāo)按以下公式進(jìn)行標(biāo)準(zhǔn)化:
注:此處“ 1”是為了避免出現(xiàn)類似“ 0 閱讀”時(shí)而產(chǎn)生無效值。
指標(biāo)加權(quán)
由于此五項(xiàng)數(shù)據(jù)影響微信傳播能力的程度不同,我們賦予不同的權(quán)重,分別記為 ωR , ωRm , ωRa , ωRh , ωZ 。
最終,新榜指數(shù)的計(jì)算公式表述為:
目前,新榜使用的系數(shù)為 ωR =0.75, ωRm =0.05, ωRa =0.1, ωRh =0.05, ωZ =0.05。
而另外一家,新媒體指數(shù)也出臺(tái)了一套自己的指數(shù)標(biāo)準(zhǔn),叫WCI,中文名字:微信傳播指數(shù);英文:wechat communication index。給出的解釋是由微信原始數(shù)據(jù)通過一系列復(fù)雜嚴(yán)謹(jǐn)計(jì)算公式推導(dǎo)出來的標(biāo)量數(shù)值,至于新媒體指數(shù)的樣本數(shù)量嘛,本人沒有深入考究,這都不重要,重要的在后面。
那么這個(gè)WCI又有什么用呢?WCI指數(shù)可以全面反映出微信公眾號(hào)推送文章的傳播度、覆蓋度及公號(hào)的成熟度和影響力,從而反映出微信整體熱度和公眾號(hào)的發(fā)展走勢。
而WCI指數(shù)又是怎么算出來的呢?WCI用最高閱讀數(shù)、日均閱讀數(shù)、篇均閱讀數(shù)、日均點(diǎn)贊數(shù)、篇均點(diǎn)贊數(shù)和最高點(diǎn)贊數(shù)六個(gè)指標(biāo)對(duì)微信賬號(hào)進(jìn)行評(píng)估。
同樣的,考慮到各指標(biāo)在反映傳播能力方面存在差異,新媒體指數(shù)也賦予了6個(gè)指標(biāo)不同的權(quán)重,最終的計(jì)算公式如下:
相對(duì)具有行業(yè)代表性的,第三家公司微指數(shù),算是起步比較晚的,但是號(hào)稱可同時(shí)監(jiān)控1000萬公眾號(hào),請注意這里的說法是可以同時(shí)監(jiān)控,并沒有說每天會(huì)去更新1000萬公眾號(hào)的數(shù)據(jù),稍微懂點(diǎn)技術(shù)的人都知道,一個(gè)創(chuàng)業(yè)公司如果運(yùn)行這么大數(shù)據(jù)的話服務(wù)器成本得有多高,樣本數(shù)量請自行猜測,這里不便透露。
而微指數(shù)對(duì)于賬號(hào)質(zhì)量的監(jiān)控指標(biāo)是:7天平均閱讀、7天平均點(diǎn)贊、每天發(fā)布條數(shù)、有效累計(jì)粉絲、有效日活粉絲。除了最后兩個(gè)因素,其他都是毫無技術(shù)含量即可獲取到的數(shù)據(jù)指標(biāo),跟前面介紹的兩家其實(shí)并無不同,只不過新榜和新媒體指數(shù)在這些人人肉眼能夠看到的數(shù)字上加入了人為干預(yù)系數(shù),使之更加趨向于真實(shí)數(shù)值。
微指數(shù)呢,則是提出有效累計(jì)粉絲的概念來有理有據(jù)的告訴消費(fèi)者我說的是對(duì)的,你不需要懷疑。為什么呢?因?yàn)槲疫@個(gè)概念不是說賬號(hào)真實(shí)的粉絲數(shù)啊,而是有效累計(jì)粉絲。
這個(gè)概念值是怎么來的呢?是這樣的,前面我提到過一個(gè)公眾號(hào)的閱讀轉(zhuǎn)化率平均在8%-10%區(qū)間,那好,閱讀數(shù)不是都能看得到嗎,而且我還可以做出平均值來,甚至我可以說我去除了刷量帶來的虛假閱讀,有效累計(jì)粉絲的值就是根據(jù)閱讀數(shù)倒推來的。
你不信嗎?如果你真實(shí)的粉絲比我展示的數(shù)字高,那么我可以告訴你高出來的那些是僵尸粉,你無法反駁,而我根據(jù)微信官方平均轉(zhuǎn)化區(qū)間倒推出來的數(shù)字絕對(duì)不會(huì)有錯(cuò),當(dāng)然其中也加了一些權(quán)重,跟新榜、新媒體指數(shù)的權(quán)重添加類似。
同樣概念,新榜也在去年末的時(shí)候推出,但是面臨的同樣的問題是預(yù)估粉絲跟賬號(hào)真實(shí)粉絲差距太大,差距的縮小只好拿加權(quán)重來平衡和消除。
看到這里,不管你對(duì)前面列舉的公式懂沒懂,相信對(duì)于所謂的微信大數(shù)據(jù)概念有了些許的認(rèn)知了吧,微信公眾號(hào)遠(yuǎn)沒有你們想象的那么封閉和神秘,很多數(shù)據(jù)都是可以通過第三方手段進(jìn)行抓取,并且整合分析,進(jìn)而得出相應(yīng)的合乎常理的解釋或者榜單數(shù)據(jù)來。
自從閱讀數(shù)出現(xiàn)之后,微信的很多數(shù)據(jù)就出現(xiàn)在了人們的眼中,當(dāng)然隨之而來的另一個(gè)弊端就是刷量平臺(tái)應(yīng)運(yùn)而生,很多賬號(hào)存在閱讀量造假的問題,但是閱讀量造假這事兒目前來說還沒有平臺(tái)監(jiān)測可以做到,因?yàn)榉?wù)器成本太高,且并無多大意義,本身互聯(lián)網(wǎng)的水就很深,所有內(nèi)幕大白于天下終歸是不好的。
所有第三方平臺(tái)說可以監(jiān)測到任何賬號(hào)閱讀量造假的說法都是吹牛逼,因?yàn)槟壳暗谌奖O(jiān)測平臺(tái)判定一篇文章閱讀量是否真實(shí)的依據(jù)依然是對(duì)比近期平均閱讀的浮動(dòng),而這是可以通過刷不同文章的閱讀進(jìn)行模擬真實(shí)閱讀的。
微信公眾號(hào)后臺(tái)現(xiàn)在也出了文章閱讀的來源來規(guī)避刷閱讀量的現(xiàn)象,但是就在公眾號(hào)后臺(tái)升級(jí)顯示閱讀來源的第二天,某刷量平臺(tái)就出現(xiàn)了應(yīng)對(duì)措施,可以刷來源于不同渠道的閱讀數(shù),真是道高一尺魔高一丈。
對(duì)于第三方平臺(tái),通過獲取微信公眾號(hào)的部分?jǐn)?shù)據(jù)分析整合號(hào)稱大數(shù)據(jù)實(shí)屬過分吹噓,就連搜狗作為微信的合作伙伴都拿不到所有的微信接口,而你第三方平臺(tái)僅僅是抓取了用戶眼見的數(shù)據(jù)指標(biāo)就敢號(hào)稱微信大數(shù)據(jù)?我看你們所謂的大數(shù)據(jù)不過是大概的數(shù)據(jù)吧~
另外,透露一下,真正能夠監(jiān)測到閱讀量造假的技術(shù)是將監(jiān)測閱讀數(shù)的時(shí)間無限細(xì)分,時(shí)間段無限取中位數(shù),最后描繪出較長時(shí)間周期內(nèi)的閱讀走勢。而這樣以來會(huì)大大增加服務(wù)器的成本,刷閱讀量的服務(wù)器成本是遠(yuǎn)遠(yuǎn)低于監(jiān)測成本的,所以有水分的互聯(lián)網(wǎng)還是不要太過吹毛求疵的好,睜一只眼閉一只眼,你高興我也自在。
總體來說呢,說到微信大數(shù)據(jù)分析,不過是可見數(shù)據(jù)的統(tǒng)計(jì)學(xué)展示,至于粉絲用戶人群畫像以及行為習(xí)慣等因素,已現(xiàn)有的監(jiān)測手段和接口開放程度來說是根本不可能的,如果有哪一方宣稱可以制作人群畫像,那也不過是基于手機(jī)型號(hào)大概推測用戶購買力,用戶地區(qū)分布進(jìn)行區(qū)域劃分,男女性別比例進(jìn)行行業(yè)領(lǐng)域?qū)?yīng)等等,而相對(duì)較聰明的做法是將公眾號(hào)對(duì)應(yīng)的微博賬號(hào)粉絲進(jìn)行人群畫像分析,同樣的結(jié)合部分可見數(shù)據(jù)加權(quán)處理,模擬出大概的人群畫像,如果不準(zhǔn)確,那就多加幾個(gè)維度往最準(zhǔn)確的人群畫像進(jìn)行靠攏。
而用戶,尤其是廣告主,需要知道也無非就是賬號(hào)的有效累計(jì)粉絲,日活躍粉絲以及平均閱讀數(shù)或者頭條平均閱讀數(shù),至于更垂直更嚴(yán)苛的要求對(duì)于廣告投放來說還不是太需要,相比之前公關(guān)公司只給到粉絲數(shù)和廣告報(bào)價(jià)來說,現(xiàn)有的第三方監(jiān)測已經(jīng)做得稍微好一點(diǎn)了,但是別以為做到這樣就是準(zhǔn)確的大數(shù)據(jù),還僅僅是大概數(shù)據(jù)而已,謹(jǐn)以此文告誡公關(guān)公司和廣告主們,不要對(duì)第三方公司的所謂大數(shù)據(jù)過分信賴,那也只不過是服務(wù)器幫助人做了計(jì)數(shù)平均取值的活兒而已。
而這種數(shù)據(jù)服務(wù)加到具體的自媒體大號(hào)報(bào)價(jià)里面那可就是你該掏錢的了,具體利潤值多少在此就不便細(xì)說了,行業(yè)內(nèi)不同公關(guān)公司報(bào)價(jià)是不一樣的,基于創(chuàng)意策劃的附加值服務(wù)加錢合情合理,但這種數(shù)據(jù)服務(wù)如果加價(jià)過高只能就有點(diǎn)太一勞永逸了。