第87屆奧斯卡頒獎禮22日在洛杉磯落下帷幕,如果你當時正眼巴巴盯著電視機或計算機屏幕等待評獎結果,那可有點落伍了。要知道,最早命中奧斯卡各重頭獎項的,并非捧起小金人的《鳥人》導演亞歷杭德羅·岡薩雷斯·伊尼亞里圖,也非“影帝”埃迪·雷德梅或者“影后”朱莉安·摩爾,而是幾乎無處不在的大數據。
無論是世界杯、超級碗,還是總統選舉,如今不少美國人都愿意首先看看大數據怎么說。大數據在預測方面的不俗表現,不僅可以讓商家、政客得以精準投錢,也可以引導未來市場和產品走向,在更深遠的范圍內尋找規律、解決問題。
相比這些大型比賽和活動來說,預測有點“任性”的奧斯卡,難度系數當屬最高級別。為奧斯卡投票的6600名電影藝術和科學學會成員是個匿名團體,對這個團體建立數學模型進行奧斯卡評選結果預測向來不被看好,而測算全球影迷喜好與投票人以及提名影片的關聯度也難度頗高。與業內權威人士觀點相比,大數據的勝算貌似不大。
曾在美國總統選舉預測中表現出眾的數據分析網站“538網站”就曾發表題為“為何難以預測奧斯卡得主”的文章,并得出結論認為,如今準確預測奧斯卡的模型也許并不存在。
不過,包括“538網站”在內的數據分析公司和相關專家,并沒有“放棄”奧斯卡。在本屆奧斯卡角逐中,在數據分析方法、數據挖掘、數據建模等方面的相關探索不斷涌現。
早在奧斯卡頒獎幾天前,微軟研究院經濟學家戴維·羅思柴爾德就在他和他的團隊開設的“聰明預測(PredictWise)”網站上公布了大數據預測結果,準確預測了本屆奧斯卡最佳電影、最佳導演、最佳男女主角,以及最佳男女配角這些重頭獎項的獲獎者,準確率為100%,而對全部24個獎項也準確預測出其中21個。
羅思柴爾德使用的分析預測模型基于博彩市場、好萊塢證券交易所的大量數據建立,其預測結果會隨著時間和數據的變化而更新。去年,專門從事數據預測分析的羅思柴爾德也準確分析出奧斯卡24個獎項中的20個。
而與以往相比,類似嘗試更為多樣和豐富,不少數據分析公司和專家均希望借奧斯卡良機探索和驗證自己的新技術或新算法。“538網站”利用奧斯卡前16個重要獎項的評選結果進行數據分析;“指數(Exponential)”公司試圖利用數據模型找到提名影片在影迷群體和投票人之間的關聯度;數據公司“森扎里(Senzari)”負責運營的“電影圖表(MovieGraph)”服務平臺還研究起提名影片是否包含悲劇、涉及道德等因素,他們認為,在過去10年中,超過一半的獲獎影片打出了悲情牌……
無論那些為奧斯卡設計的數據模型和計算方法是否能得出足夠理想的最終結果,但可以肯定的是,數據分析和預測已經成為趨勢,大數據正嘗試將眾多領域“科學化”,就連藝術也無法置身事外。