中國什么時候才能有自己的《紙牌屋》?或許已經為時不遠了。印象中,離互聯網很遠的娛樂圈,已經開始利用大數據進行各種嘗試了。
前幾天,黑豆碰到了老夏,他就正在做這樣的事。老夏名叫夏宗靚,成立了一家名叫艾漫科技的大數據公司。如果把艾漫科技當成影視圈的一個幕后人員,它早就是腕兒了。《小時代》和《北京愛情故事》兩部賺得盆滿缽盈的電影,幕后都有艾漫科技提供大數據支持。
2013年《小時代1》6月上院線之后,艾漫科技的大數據系統發現觀眾對郭敬明的導演功力有質疑,同時,某一個男主角的表現非常不能讓觀眾滿意,而這個時候《小時代2》已經拍完。綜合大數據結果艾漫建議《小時代2》在七夕中國情人節檔上院線,因為如果等待半年之后上映,關注度下降的同時,郭敬明的導演水平會受到更多質疑。這是中國電影史上都是少見的操作手法,當然,票房的成功驗證了這個決策是正確的。
大數據同樣可以用于選角和戲份刪減。艾漫科技還建議:由于其中某個男演員口碑較差,后續戲份需要刪減;而女二號的表現突出,戲份應更多增加。此外,由于小時代系列的82%的關注者都是90后,而對這個人群的作息時間來講,晚上十點的排片可能比傳統的晚上八點黃金檔更合適;還有應更多地在二三線市場進行排片和在營銷時重要的宣傳點應著重放在“朋友、友情、人性”等。這些建議最終都被片方采納。
其實黑豆一直認為,大數據做的就是了解“人”的事情。無論現實社會還是虛擬社會,只要我們有了身份、ID我們就會有所顧忌,所以未必敢表達我們的真實感受。有的時候,我們內心想要的甚至我們自己也說不出來。但這一切都會表現在我們的行為上,誰愿意承認自己八卦呢,但這并不妨礙我們在文章事件曝出后,翻翻三個人的過往情史。很多人批評《小時代》紙醉金迷,這不妨礙我們依舊看著這部電影,在心里偷偷向往一下,甚至我們都不知道自己在向往。在互聯網上,娛樂是用戶最重要的幾件事之一,大數據能做到的更了不起的事情是——“找到你內心的小惡魔”,并用內容把小惡魔飼養好,轉而讓我們更加了解自己。
從這個角度看,娛樂信息的確比很多門類更容易直射內心。不過黑豆想到的事情,其它人必然也會想到,這塊遲遲發展不起來大概有幾個原因:1、中國娛樂產業本身的互聯網化程度還比較初級;2、再精準的數據到很流弊的作品之間也少不了“人”的加工,數據再準,沒有好導演,一部粗制濫造、各種情節拼湊在一起也未必有人看吧。3、大數據的效果無法像電商那樣精準衡量,但背后的技術要求卻更高。
互聯網圈都有個習慣,一聽到大數據,就得問在數據量、技術上有什么優勢。其實前幾年老夏做的事情都是把非結構化的數據變得結構化,那時百度也提出了類似的概念,你就知道他們做得事情有多難。現在對外,老夏解釋類似問題答案很直接:“在中文文字處理上,艾漫科技數據源是最大的,處理速度是最快的,識別是最準的,沒有之一。還有就是,不需要人工參與判斷。”
老夏常說自己是影視行業的“黑衣人”,掌握著最新科技為影視圈的星球大戰保駕護航,任務完成后,就用記憶消除器對著自己閃一下。身在娛樂圈,艾漫科技超過70%的人卻是技術宅男,不擅長制造話題和緋聞。“就像我們服務器上存儲的1.4PB數據一樣,艾漫會持續每天海量存儲全網數據。”老夏解釋,真正做好大數據,需要動態、連續、完整的數據積累,而不是博曇花一現。“到艾漫科技廣為人知的時候,我們存儲的數據或許已經達到10PB、甚至100PB了,而且這些的數據能發揮的價值遠超過容量的價值”。2012年《紙牌屋》讓人們知道有一種神奇的工具叫大數據,卻不知道那時艾漫科技已經在影視商業立項、主創評估、制片輔助、宣傳發行、動態票房預估等領域開始嘗試了。《小時代》、《北愛》、《最美和聲》等知名作品都和艾漫有大數據合作,原來這些好作品都是上了科技手段的。目前艾漫的電影票房預測已經控制到10%的誤差,2014年開始,自己建設了大數據系統的視頻網站也開始尋求艾漫科技這樣的“外腦”,成功的自制內容有騰訊視頻的《探靈檔案》、《Are you normal》等。
但老夏只想讓大數據成為影視、音樂等娛樂產品的“拐杖”。娛樂和互聯網看似風馬牛不相及,但越跨界就越有意思。他本身就是個跨界人,畢業于清華大學,在IT圈工作多年,后來又進入了音樂圈,曾擔任海蝶公司總裁。
最先嘗鮮的是那些對高科技很有Feel的導演,比如對新銳90后口味最了解的郭敬明、導演了《泰坦尼克號》的好萊塢大導演詹姆斯·卡梅隆(他在《深海挑戰》中和艾漫進行了大數據合作)。這也是老夏最喜歡的一類客戶,他們對大數據的認識更加理性:不需要老夏用數據去證明自己的決策多么睿智、偉大,相反,他們和那些優秀的產品經理一樣,更關注用戶在想什么。“大數據不是為了證明什么是對的。它研究的不是因果,而是相關關系。大數據也不能保證成功,只是在不斷提高成功的幾率,因為通向成功的路上,變量太多了。”老夏說,“未來每一個影視內容的產生,都是藝術感性創造和大數據理性支持的疊加,缺一不可”。
話說回來,以黑豆對大數據的淺薄理解,一聽到創業公司要做大數據還是有些擔心的,因為大數據正是BAT抓緊在做的事情啊,可真不是創業公司輕易玩得起的。而且優土、愛奇藝等視頻網站都在做自己的大數據系統,為買劇、制劇做出指導,和創業公司比起來,他們怎么看都能算得上財大氣粗。
但有了技術能力后,艾漫做的事情還是有巨大的市場空間。中國娛樂文化市場很大,但做娛樂文化內容深度挖掘的公司很少。而且這些事情,BAT也需要,卻未必有精力專門搭建團隊做的事情。艾漫抓取的是全網的娛樂數據(除了微信朋友圈現在還沒開放權限),這些數據多、雜、散、匿。大公司一講自己的大數據優勢就是自己體系內海量數據的積累,或者完善的賬號體系,而艾漫科技可以為任何一個客戶提供總平臺的數據和分析。一部電影、電視劇或是綜藝節目,大數據的作用是分析觀眾口味是什么,喜歡怎樣的橋段,而不是針對個人。《北愛》中艾漫通過內容聚合,發現北京的80后的愛情觀,尤其是北漂,是玫瑰加房子。
做大數據首先要能正確地理解并搜集數據。在自然語言理解上,艾漫可以在博大精深的漢語中精準的抽取關鍵詞以及觀點并做出情感的分析判斷(這在一般的大數據體系里是做不到的)。而且在消除歧義上,艾漫也很有心得,文章事件中,他們絕對不會把“演員文章”和“一篇文章”中的兩個詞弄混。針對相關內容,艾漫可以自動歸檔,更牛的是,大數據系統可以自動給這些文章做出摘要。
搜集數據之后,還需要挖掘。如果有突發事件曝出,系統可以自動進行全網的時間傳播與追蹤。聽到這里的時候,黑豆邪惡的想了一下,如果再出艷照門,是不是宅男們就不用各大論壇去翻帖子了,始終有最新版的內容看。此外還能根據關鍵詞形成大規模的知識圖譜,類似的知識圖譜我們其實已經在搜索引擎或者人立方等產品中看到過了,但艾漫的知識圖譜是多信息的,你不僅能看到關鍵人物、或者事件,而且每個關鍵點上還有相關新聞鏈接和摘要供閱讀。
而且艾漫非常重視來自微博、評論、貼吧等各種社交產品中的數據,因為那背后的才是一個個真實的“人”。這意味著,即便對有了大數據系統的視頻網站,艾漫也能告訴它更多,比如誰在討論什么,這個劇為什么火。
黑豆非常期待的是,很快這些用于尋找人類心中“小惡魔”的大數據系統就要被開發成面向用戶的toC類產品了。艾漫做影視To B類客戶服務,是讓影視作品都符合目標用戶的YY;做娛樂資訊To C類用戶服務,則是為了驗證老夏自己的YY。
至少以目前的艾漫的手段,早期產品就可以讓用戶越來越“懶”:不需要花超過3秒的時間就能讀懂一篇新聞;甚至不再“讀”新聞,直接變成圖片來看新聞。媒體的態度不再重要,用戶的態度才是最重要的;每個人都不再是信息的孤島,因為每個人都能找到自己價值觀的認同者;每個人都是信息的接收者,也是信息的傳播者。
但黑豆內心更期待在它的產品入駐了我們手機,對我們有更多了解后,能幫助我們找到內心的小惡魔,畢竟,了解自己這件事吧,太難了。擁有直面真實的自己的勇氣,也太難了。比如黑豆自己,當老夏告訴我,每一個社交賬號后面的行為,艾漫科技都貼上了20個標簽的時候,我后背涼颼颼的。我何時是天使,何時是魔鬼,大數據竟然比我還清楚。
但黑豆還是愿意有這樣的產品使用,只是要友情提醒先:不要因為我們走得太遠,忘了我們為什么出發。