今年《紙牌屋》的收視大火,讓Netflix這家原本只做在線租賃DVD的公司成為算法節(jié)目制作成功的典范。但在優(yōu)酷土豆策劃總監(jiān)陳漢澤看來,《紙牌屋》僅僅是Netflix的精準(zhǔn)營銷的產(chǎn)品,并非眾人口中的依靠大數(shù)據(jù)分析的劇作。“聽說Netflix老總是聽取了下屬的建議,才決定拿下該劇的改編和發(fā)行權(quán),而這名下屬是英劇《紙牌屋》的忠實粉絲。”
媒體人出身的陳漢澤對大數(shù)據(jù)持一種審慎的態(tài)度。她認(rèn)為,大數(shù)據(jù)只是一個工具。在大數(shù)據(jù)之前,早已有統(tǒng)計學(xué)邏輯和數(shù)據(jù)挖掘技術(shù)。比如大數(shù)據(jù)在互聯(lián)網(wǎng)的最早應(yīng)用是流量分析。2005年前后,互聯(lián)網(wǎng)通過門戶網(wǎng)站開始訪問,是流量的主要入口。但到了2011年,最大的流量源自于視頻網(wǎng)站。
在優(yōu)酷土豆合并之前,陳漢澤在土豆網(wǎng)負(fù)責(zé)自制劇業(yè)務(wù)。她說,數(shù)據(jù)模型可以精準(zhǔn)地識別出在每一部劇里,哪一分鐘用戶視線離開、重看、拖放觀看。這些數(shù)據(jù)為自制劇選擇題材、設(shè)計橋段提供極大的參考價值。在好萊塢電影劇本的精細(xì)化生產(chǎn)工序中,“劇本醫(yī)生”扮演了極其關(guān)鍵的角色,他們通常會改編劇本以強(qiáng)化某個情節(jié),突出某個橋段。而大數(shù)據(jù)分析技術(shù)正是陳漢澤口中的“劇本醫(yī)生”,借助大數(shù)據(jù)可以分析出觀眾喜歡的劇情元素。
Netflix上排名前十的影片,分別代表了不同家庭成員對觀影的需求。另外,十部影片也可以分別對應(yīng)不同時間、處于不同情緒下消費者的需求。這背后是對收視群體的多維度分析。陳漢澤說,視頻排序的背后是一套清楚的邏輯體系,了解排序和目標(biāo)指引,才能更準(zhǔn)確地推薦給消費者。
五年前,網(wǎng)絡(luò)上一段視頻的爆紅通常基于一個點狀擴(kuò)散的模式,屬自發(fā)的、分享式傳播;但隨著網(wǎng)絡(luò)視頻行業(yè)逐漸轉(zhuǎn)向以自制劇、采購電視節(jié)目為導(dǎo)向時,視頻公司必須對觀眾有一個量化分析的過程。基于大數(shù)據(jù)分析得出的這份數(shù)據(jù)報告,又可以為電影電視制作方、廣告商、第三方統(tǒng)計機(jī)構(gòu)所用。
廣告主已不再滿足于傳統(tǒng)的貼片廣告營銷模式。原先視頻網(wǎng)站重視的PV,現(xiàn)在變成為更關(guān)鍵的指標(biāo)ROI。“馬化騰在近期的演講時提到,連接一切,互聯(lián)網(wǎng)+創(chuàng)新涌現(xiàn),開放協(xié)作,消費者參與決策,數(shù)據(jù)成為資源,順應(yīng)潮流的勇氣和連接一切的風(fēng)險。而大數(shù)據(jù)營銷的潮流便是移動端的崛起。”陳漢澤說。
在PC時代,基于cookie和邏輯分析來追蹤和分析用戶信息是慣用手段。但由于移動端瀏覽器沒有cookie, 再加上cookie對用戶隱私的放任,谷歌等巨頭正開始尋找新的數(shù)據(jù)分析模型。
陳漢澤認(rèn)為,未來可以利用大數(shù)據(jù)的模型。例如,用戶在手機(jī)上先打開A網(wǎng)站,長時間訪問后,會產(chǎn)生一些交互行為,而這些數(shù)據(jù)將會共享到下一家他瀏覽的網(wǎng)站。這必須基于A網(wǎng)站和B網(wǎng)站之間的協(xié)助,他們之間可能產(chǎn)生千絲萬縷的聯(lián)系。所有的數(shù)據(jù)都是共享的,這也是“連接一切”的意思。
“谷歌的PPC模式(每點擊一次谷歌網(wǎng)絡(luò)廣告,廣告客戶就需要谷歌支付一定費用)可能很快就不適用。”陳漢澤說,今后的模式是,用戶經(jīng)過A網(wǎng)站、B網(wǎng)站,直到N網(wǎng)站,廣告主才實現(xiàn)最后的盈利,但之前的瀏覽過程也能參與到盈利的分享。
不過,大數(shù)據(jù)技術(shù)也有其局限性,包括樣本選擇的有限性、數(shù)據(jù)篩選過程的真假判斷、分析邏輯的正確與否,都能影響到最后的結(jié)果。
《大數(shù)據(jù)時代》作者維克托·邁爾·舍恩伯格認(rèn)為,大數(shù)據(jù)時代只需要人們知道是什么,而無需知道為什么。正如商家不必理會為什么啤酒和紙尿褲的銷售能如此匹配,只要抓到商機(jī),采用交叉組合的戰(zhàn)略提升業(yè)績,無需搞清楚背后的商業(yè)邏輯。如果非要把所有事情都分析清楚才做出判斷,損失的是眼界和時間成本。關(guān)聯(lián)性遠(yuǎn)勝過因果性,但這在陳漢澤看來是一個過激的論調(diào)。“難道所有的頁面排序通過數(shù)據(jù)模型就能完成,不再需要編輯了?”
她認(rèn)為賣故事、講故事的人不死,內(nèi)容永生,編輯依然能發(fā)揮作用。譬如傳統(tǒng)視頻網(wǎng)站多以動作片、喜劇片、愛情片等類別分檔,但在Netflix有上,有一個很小的類別,比如cult影片也被視作一個門類,這是基于編輯對內(nèi)容的理解和人腦智慧的產(chǎn)物,這是數(shù)據(jù)無法抓取的。