一部電影或一部電視劇,想要獲得觀眾認可,除了擁有高顏值、高演技的演員外,很大程度上依靠的還是編劇精心的劇情設置。7月22日的“影視遇到大數據巔峰思享會”上,關于機器能否讀懂并篩選劇本的問題引發了影視圈與數據界的巨大關注。
來源:數據猿 記者:張葉
精彩繼續!
一部電影或一部電視劇,想要獲得觀眾認可,除了擁有高顏值、高演技的演員外,很大程度上依靠的還是編劇精心的劇情設置。換言之,劇本始終還是影視劇獲得高收視的制勝法寶。
此次分享會上,關于機器能否讀懂并篩選劇本的問題引發了影視圈與數據界的巨大關注。
在影視從業者看來,數據參與影視制作與推廣的過程,可能更多的是對演員、導演的評估、對觀眾喜好的統計,以及利用線上線下數據對票房的預判行為。那么利用大數據,究竟能不能讓機器對劇本做很好前期篩選呢?我們來聽聽愛夢娛樂的雷鳴怎么說?
雷鳴 ABD愛夢娛樂CEO
雷鳴:ABD愛夢娛樂是一家研究娛樂媒介的公司。所謂的娛樂媒介,包括明星藝人、院線電影、周播電視劇、網絡內容等方面內容。但我不覺得愛夢娛樂就是一家純粹的大數據公司,因為我們搜集這些數據,主要是研究它們在娛樂市場上可能會導致的結果。
我們在藝人和影視內容方面做了兩年多研究,現在整個團隊對院線電影和網劇內容有很高的商業敏感度。我們的很多市場分析結果,也跟傳統人士看法不一樣。
我們發現,所謂公開的數據和我們得到的數據,比如輿情監控,其實并沒有真正解決影視制作過程中的很多本質問題。大家用到的一些指數,實際上有很多盲點。另外,在內容模型上,我們覺得劇本類型即市場,市場即觀眾,也就是說劇本決定了一部片子本質上針對的人群會是哪些,但對一部真正的院線電影而言,在劇本選擇階段會耗費大量精力。
所以我們現在在教機器讀劇本,做早期篩查。而且機器不僅要讀懂劇本,讀完之后還要給出分析結果,比如,這個劇本拍攝完成之后,電影明年上映,那么在不同檔期里的票房區間可能會是多少?
這件事聽起來匪夷所思。但事實上,從今年1月到3月,我們已經搜集了過去3到5年上映的、有票房結果的、不同類型的大概100部電影,之后將這100部電影劇本作為機器的訓練冊,最終機器給出的分析結果,與電影實際票房相比,準確率能達到25%。
牟蕾 數據猿創始人(左)
牟蕾:你們具體怎么教機器閱讀劇本?電影題材有那么多種,這100多部劇本,你們是按什么原則挑選?
雷鳴:為了讓機器理解劇本,我們會讓懂劇本的人從內在沖突、外在沖突、主人翁的確立、劇情矛盾性等幾個方向“教”機器讀劇本。這也是跟電影學院的專業學生在分析劇本時是一樣的角度。也就是說,機器在讀劇本之前,肯定是人先去打標簽。目前我們已經設定了大概22個維度讓機器分析。
雖然讓機器讀懂并篩選劇本是件很難的事情,但在北美,這件事情已經做了至少10年。
另外,挑出的100多部用于訓練的劇本,雖然類型很多,但像低成本的懸疑類、驚悚類我們一般不太考慮,這也就一定程度上降低了因類型過多導致的分析難度。
劉鵬 貓眼電影大數據中心高級經理
劉鵬:機器讀懂劇本后,如何對電影進行票房預測?你們從哪幾個維度進行數據分析?
雷鳴:在我們的數據模型里,電影的類型和劇本決定票房成功的概率是60%。機器在做票房預測的時候,會從三大方面進行分析,這也是我們主要研究的方向。
首先,是演員。在中國院線電影和網絡電影市場上,演員是有票房號召力的。當劇本進入拍攝階段,演員的上一部電影情況對這部電影的口碑和指數是會產生影響的。我們會用數據告訴制片方,這個演員在這種類型下表現的好不好,大家的預期會不會降低。
事實上,從近兩年的數據監控上看,明星對院線電影票房影響最大的時間節點是上映首日,到第二天的時候,明星的大牌程度與票房關聯度會降到32%左右。
第二,我們經常說到IP,IP對一部院線電影的整個影響其實也只在放映前三天,而且第三天就已經很弱了。
電影《中國合伙人》,因為有新東方這個大IP,又安排在暑期檔,可是票房只在5000萬左右,原因是中國社會對女性創業這件事情其實并不太關注。事實上,絕大部分國產片都是這樣,即使有明星號召力,但票房就是上不去。
我們對2015年上映的每一部電影都用機器做了票房預測。在上映的7到10天內,準確率能達到64%。在這個過程中,購票網站的用戶數據、市場數據都會被我們列入參考數據。因為我們自己的數據沒那么多,所以也做了大量線下問卷。但如果可以和你們貓眼合作,那么我相信機器對票房預測的準確率還會上一個臺階。
第三,我們還會對觀眾進行研究。在做票房預測時,我們有16個“票倉人群”分析,基本會知道什么樣的電影是什么樣的人在看。而且,我們根據城市級別,對觀影人群做了六個層次的數據分析,第一層和第二層是嘗鮮的人群,他們看完電影之后沒什么信息反饋,也沒留下什么口碑,如果一部電影的觀影情況是這種程度,很可能就會下線。
此外,我們還分析發現,三四線城市的觀影人群很容易受題材和線下口碑影響。
吳曉 阿里數娛原創出品總監
吳曉:你們用機器閱讀電影劇本并預測票房,那么對網絡電影和網劇劇本有數據模型嗎?
雷鳴:我們主要研究商業電影。在我看來,網絡電影或者網劇首先要解決的不是內容好壞問題,而是要有基本的故事線。
我們都知道,優質的故事內容一定會對整個影視劇制作有幫助。但是反過來,中國真正開發院線電影和電視劇項目的人數遠遠不足,其中還有一部分人去做網劇,那么,我想這些人制作出來的內容可能并不會太好。
不過,在網絡方面,我們今年開始做網絡藝人的數據分析和融合。各種網紅數據投放到模型上,得到的結果非常有意思。因為網劇和電影不一樣,雖然受眾范圍小,但網劇明星的作用比院線電影明星大的多,而且在品牌端,哪些產品植入到哪類網劇中效果會更好,這也是機器特別難理解的事情。所以目前機器在這方面也只是嘗試做分析。
劉倍貝 愛奇藝自制劇中心資深制片人
劉倍貝:我再來補充一點,網劇的觀眾主要以年輕人為主。所以網劇更注重標題入口,也許一張海報就能體現它的營銷思路,看出來是不是具有吸引力。而且網劇的制作前期,會用很長時間做營銷鋪墊,即使熱搜的關鍵詞不那么清晰、明確,也可以通過前期宣傳片、概念片,包括核心宣傳的價值點,逐步吸引觀眾來看。所以從這些角度看,我覺得機器更適合分析網劇。
雷鳴:我們也發現了這個問題。事實上,對機器來講,網劇的題材、片名,都更容易作為流量入口。我們希望通過數據挖掘,能知道每一種垂直人群他們感興趣的點是什么,什么樣的題材和標簽是具有吸引性的,這樣就能更好的讓機器分析。總之,我們想利用機器解決中國影視制作行業內容方面的問題。
而通過這幾年的研究我們發現,大數據實際上解決了影視制作的三大問題。第一,項目開發,也就是劇本選擇問題,這也是中國院線電影的制作瓶頸;第二,藝人問題。我們經常見到,在影視立項過程中,挑選了很久的演員結果要么因為檔期來不了,要么就是來了之后發現角色根本不合適,所以分析演員是很有必要的;第三,優質項目和優質資源的匹配問題。
The end
后記:
人工智能是大數據技術發展的未來,試想阿爾法狗都戰勝了李世石,機器讀懂劇本又有什么不可能?
雖然我們此次的巔峰思享會已經結束,但行業內對影視大數據的研究與探討還遠沒有結束。無論什么樣的研究,大家的目標都是一致的,那就是為觀眾提供更娛樂化、更個性化的內容,真正將中國電影電視劇打造成能滿足觀眾需求的優質產品。
大數據已經慢慢滲透到各行各業,距離我們的生活已經不再是咫尺天涯,以后數據猿還會與更多行業的人士一起探討大數據的應用與發展方向。敬請期待吧!