昨日,一篇文章《為什么大數據在預測《黃金時代》票房時不靈了?》引發行業熱議,這篇文章以百度對《黃金時代》的票房預測遭遇滑鐵盧為例,講述了目前國內票房預測的尷尬現實。
不過,票房預測失靈,是否意味著大數據對于電影業就全然沒有價值了呢?在娛樂資本論看來倒也未必。
今年6月,小娛曾寫過一篇關于電影大數據的文章,采訪中發現,大數據至少在劇本研發、演員篩選、宣發策略制定等方面,依舊有一定的空間。只是,“數據臟”已成為中國大數據行業發展的“原罪”,而且,中國電影行業運行中存在的諸多隱秘邏輯,也對大數據的解讀提出了更高的要求。
中國電影業開始相信大數據了嗎?
在電影行業,“大數據”是一個熟悉又陌生的詞。有人將它比作青春期少年口中的“性”——“大家都在談論它,但沒有人知道如何操作;每個人都以為別人在做,于是都聲稱自己正在做。”
不過,情況正在發生變化。
谷歌公司通過數據收集和建模,已實現了提前一個月預測票房的目標,準確度達94%,這將為電影的宣發策略提供直接指導。
目前國內也有類似的服務了——根據電影首映日的票房,預測最終的票房成績。電影《后會無期》就購買了這樣的服務,提供數據支持的公司名叫ABD愛夢娛樂。
只是,愛夢娛樂對《后會無期》的票房預測與實際結果之間出現了較大偏差,數據模型推算的票房是4.3億到4.8億,但截至記者發稿,這部電影的票房已過6億。
這就像是一則隱喻——對于國內正快速發展的大數據行業來說,希望實現影片投資、制片、宣傳的“全生命周期”服務;但對于片方來說,大數據的分析,僅供參考。
從數據,到“大數據”
7月22日,《后會無期》上映前2天,影片宣傳方收到了一份“大數據分析報告”:“強烈建議調低受眾的觀影預期。韓寒的口吻應該適當謙遜,必要的時候可以自黑。”
這份報告來自為《后會無期》提供了數據服務的ABD愛夢娛樂公司。這或許是中國電影行業在大數據應用方面的一個最新個案。在《后會無期》之前,《小時代》、《北京愛情故事》、《人間小團圓》等影片都向業內的大數據分析公司采購過數據服務。
電影行業對于數據的日趨重視是不爭的事實。
“以往電影行業不太重視數據,因為電影是藝術品,不是產品。寶潔的一款產品可能從設計、調研、生產到銷售,整個流程都需要數據支持,但電影業沒有這個意識。” 數托邦創始人楊玥說:“但隨著郭敬明、韓寒、肖央這些新銳導演進場,他們是很了解受眾的,把電影當做產品去運營的人,而且上來就是2、3億起跳的票房,讓 整個行業開始反思,怎樣了解用戶、洞察市場。”
在電影圈,樂視被認為是電影行業最“互聯網”的公司之一。樂視影業CEO張昭曾提出一個觀點——用做市場的角度去做內容。
今年7月的一次分享會上,張昭說,之所以將《老男孩》檔期從五一檔推遲到暑期檔,一個重要的原因是百度指數。“當時老男孩的百度指數不夠高,話題熱度不夠,上不了啊!”隨后,《老男孩》團隊前往韓國拍攝了4支MV,其中的《小蘋果》成為爆紅“神曲”,這讓大電影一舉拿下超過2億的票房。
此前在《小時代》選角時,張昭也提出,幾位主角的微博粉絲數加起來,必須要超過1個億。
“樂視的數據思維很值得肯定。”數托邦的楊玥表示:“但無論百度指數、粉絲數、票房數,這些都只是數據,并不是真正意義上的大數據。大數據是基于海量數據的抓取和挖掘。”
數托邦曾經做了一款“油價早知道”的產品,可以提前三天預測油價漲跌。數托邦在新浪微博上抓取提到油價的發言,發現其中700個人屬于意見領袖,再把他們的 意見提取出來經過加權得到一個結果,預測未來油價會漲還是會跌。“從去年5月到現在,我們預測了30次,準確率100%。”
在他看來,電影行業也可以有類似的應用場景,甚至實現從劇本創作,電影投資、拍攝、營銷“全生命周期”的大數據服務。
在大數據行業的設想中,未來必將出現這樣一部電影:它的劇本創作,會從數十百個微博用戶的網絡行為中攫取興趣點,供編劇創作故事情節;投資方會根據劇本和擬定的主演名單,在社交媒體上分析粉絲群體,進行投資收益分析,決定合理投資額。
緊接著,在電影拍攝后期,所有營銷已根據大數據分析的目標群體展開,根據人們的好惡、反響,討好、賣萌或者耍酷。最后,大數據會幫助投資方預測票房,拉動更多廣告植入的介入。
“目前還沒有一部電影能夠稱得上是真正意義上的大數據電影。”楊玥說。
電影行業的“大數據嘗試”
盡管真正意義上的“大數據電影”還沒有出現,但國內電影行業在“大數據”的應用上已經躍躍欲試。
《后會無期》就是這樣的案例。ABD愛夢娛樂的創始人雷鳴說,7月21日《后會無期》大規模點映,隨后愛夢娛樂把所有當天在互聯網上產生的言論進行分析,并在22號凌晨,提交了一份娛樂預警預案。
在這份預案中,愛夢娛樂將所有可能的負面關鍵詞列出來,針對每一條可能出現的負面評價,給出應對的預案。與此同時,他還強烈建議片方調低用戶預期,建議韓寒口吻更加謙遜,適當的時候可以自黑。
北京的另一家大數據公司艾曼科技,曾給《小時代》、《北京愛情故事》、《竊聽風云》等電影提供過數據支持服務。
艾漫科技的CTO郭銳介紹說,當他們對新浪微博上提及“小時代”的眾多微博用戶進行了數據分析后,建議片方加大南方二三線城市的排片量,這些城市包括寧波、福州等等,因為這些地方的網友對小時代的討論熱度更高。
艾漫還發現,女孩子們最喜歡的男演員是柯震東,建議宣傳方更多以柯震東為主打進行宣傳。
對于《后會無期》和《小時代》的數據服務大多集中在電影后期的宣傳營銷階段,而在影視劇創作前期,大數據有時也能起到意想不到的效果。
數托邦曾給克頓傳媒的編劇們提供過一次大數據的服務。
克頓傳媒希望參考日本作家東野圭吾《白夜行》的風格拍攝一部懸疑劇,于是數托邦從微博上抓取了上千個關注白夜行、懸疑劇等相關作品的用戶信息,最終發現,這些用戶都有一個共同的關注點——果殼網,尤其是對于果殼網“謀殺現場法醫”這個小組最為關注。
讓人意外的是,這些用戶還非常喜歡一部臺灣電視劇《白色巨塔》,這部劇以一所大學附屬醫院里的政治生態為背景,講述身陷其中的青年醫師們,如何在理想與現實之間掙扎的故事。
此外,這些用戶還關注窮游、馬蜂窩論壇、Lens雜志。數托邦建議克頓的編劇去這些媒體上找一找靈感,當這部劇拍攝完成,也不妨借助這些媒體進行宣傳。
這樣的分析,讓克頓傳媒的編劇很意外,也為故事創作提供了更多可能性。
尷尬的票房預測
預測未來,這是大數據最迷人的地方。如果能精準預測票房,可以幫助電影拉到更多廣告植入,也可以幫助宣傳方控制宣傳成本。
去年,谷歌曾公布電影票房預測模型,可以提前一個月預測電影的票房,準確率高達94%。在谷歌的模型中,票房預測的依據包括:電影預告片的搜索量,同系列電影前幾部的票房表現,以及檔期的季節性特征等等。
然而,同樣的模型,放在中國用卻不是很合適。愛奇藝CEO龔宇就曾公開表示,百度和愛奇藝也有類似的數據,但用這些數據來套谷歌的模型,發現準確率很低,說明中國的市場除了這些因素之外,可能還有別的因素。
“獲取數據并不難,難的是怎么建立合適的分析維度。”愛夢娛樂的創始人雷鳴說,如今市面上很多數據公司、輿情分析公司,都已經積累的大量的互聯網數據,但如何解讀,如何分析預測是難點。
雷鳴說,中國的娛樂行業有很多隱秘的規律,外行人并不了解,他的公司希望建立更適合中國市場預測模型。“比如偷票房,這在三四線城市是一件很普遍的事,我們會根據偷票房來專門建模”。雷鳴說。
愛夢娛樂的票房預測產品,是根據電影上映首日的票房,來推這部電影的總票房。他們推算票房主要依據以下幾個變量——上映首日的確切票房、上映首日的口碑、未來幾天排片率、同檔期競爭對手的情況等。
不過,對于《后會無期》票房的預測,愛夢娛樂就出現了較大的偏差。首映第二天,雷鳴給出的總票房預測是4.38億到4.88億。但事實上,《后會無期》最終票房超過了6億。
“我們高估了《白發魔女傳》的影響力。”雷鳴說,開始他以為《白發魔女傳》上映之后,會大大擠壓《后會無期》的排片量,但事實上,一些影院還是將更多排片給了《后會無期》。由于準確度還不夠高,愛夢娛樂的票房預測產品尚未商業化,預測數據只是給片方做一個參考。
相對于愛夢娛樂這樣的小公司,百度、搜狗這些互聯網巨頭在票房預測上更有野心,目前這些公司都在開發票房預測產品,但由于種種原因,沒有一款票房預測產品實現了商業化運營。
娛樂資本論注意到,百度的預測頻道已經上線,內容包括景點預測、高考預測等功能,電影票房預測產品已列入百度預測的產品線,但目前并未上線。
搜狗也沒有公開票房預測的網頁,但團隊負責人曾多次在新浪微博上公布他們的預測數據。
今年1月,搜狗的助理研究員@王曉偉alex在微博上稱,搜狗預測小黃人《神偷奶爸2》的票房為1.53億,隨后的結果顯示,這與實際結果幾乎完全一致,這 引起了一些電影界人士的驚呼。但在預測《熊出沒》時,搜狗就出現了較大的失誤,預測票房為0.64億,最終首周票房1.48億。
哈工大計算機學院甚至推出了一個名為“票房預測”的網站,只要輸入電影名稱,網站就會給出票房預測和實際票房結果。這一網站對《小時代3》的票房預測為6.0581億元,比5.16億元左右的實際票房要高出不少。
大數據“原罪”
快速發展的大數據行業,有時也會遭遇電影人的冷眼。在業內人士看來,電影“大數據”至少還有4方面的問題。
首先,數據是基于過去經驗的總結,難以預測新鮮事物。
夢工廠CEO卡森伯格就曾表示:“電影靠創造力,不靠數據分析,詹姆斯·卡梅隆創作《阿凡達》的時候,如果問觀眾是否想看《阿凡達》,觀眾根本不知道他在說什么。”
數托邦的楊玥也表示,對于電影票房的預測,《哈利波特》這樣的系列電影最容易,如果是一部全新的題材,即便是谷歌,在預測的準確度上也要打一個折扣。
其次,目前的大數據更多基于互聯網,并非真正電影購票觀眾的數據統計。
樂視影業的一位內部人士表示,談論電影《小時代》的人,與去電影院看《小時代》的人,并不能完全重合。因此,樂視影業還相當重視線下的調研,公司的地面推廣人員會在各家影院進行實地調研,并且形成數據傳回總部,最終會把線上線下的數據結合起來,作為決策的依據。
《后會無期》的宣傳負責人常杰表示,像韓寒這樣的導演在互聯網上相當活躍,可能隨便一條微博都有上萬的轉發量,粉絲們也熱衷于參與網絡的討論。相比之下,張藝 謀至今沒有開通微博,一些張藝謀的影迷可能已經人到中年,并沒有在互聯網上獲取信息、參與討論的習慣。對于他的電影來說,如果用同樣的分析方式就會要打一 些折扣。
第三,中國互聯網數據的真實性,正在面臨越來越多的質疑。
一個明星的微博粉絲中,有多少是買來的,有多少是僵尸粉,幾乎沒有人知道。愛夢娛樂的雷鳴表示,現如今技術越來越進步,讓微博的僵尸粉越來越像真粉,而隨著微博活躍度的降低,真粉反倒越來越像僵尸粉。
在中國,幾乎所有新媒體的數據,都可以用錢買到。在淘寶上,花120元能賣到1萬個新浪微博的優質粉絲,這些粉絲有頭像、有微博,如果出價到170元,這些買來的僵尸粉賬號還基本都能有100個以上粉絲,顯得更加逼真。
在論壇里,只需要花16元就可以“制造”1萬次熱帖點擊,在視頻網站上,視頻點擊1萬次的成本也僅為8元。
“數據臟”,這已經成為大數據行業面臨的“煩惱”之一。在這個行業里有一個專業詞匯,叫“數據清洗”,就是指怎樣把看起來很好看的數據還原出真是的樣貌。
“大數據公司一般會設定一些標準,把這些粉絲的數據抓出來去跑。” 雷鳴說:“可能一個5000萬的明星,真粉只有150萬到200萬。”
最最諷刺的是,中國電影行業的運轉并非全部基于商業邏輯。雷鳴說,大數據希望能幫助電影投資人降低決策風險,以最小的成本獲取最多的收益,但事實上,有些人拍電影就是為了“洗錢”,有的導演可能選某個女演員是為了“潛規則”。這種時候,任何大數據分析都已經沒了價值。