近年來,廣電行業也開始注重大數據的應用。在廣電行業領域內,并不缺乏大數據,關鍵在于如何應用大數據。觀眾除了喜歡黃金時段看電視,還喜歡在哪些時段打開電視?他們收看電視都有哪些習慣?解決這一切問題的基礎還是數據。
雖然對于多大體量的數據才能叫大數據并無定論,但可以肯定的是,行業內目前通用的收視率數據并非大數據。收視率數據是在傳統抽樣調查的基礎上產生的,來源于有限的確知樣本。這種既沒有巨大體量,也缺乏多樣性(也稱多變性)和高速率(指數據輸入輸出的速度)特征的數據,與大數據的任何一個特點都不相符,但如何利用大數據開展收視率調查,繼而形成完整、規范的流程,已成為業界關注的熱點和未來的可能趨勢。
傳統的收視率數據完整地反映了用戶收視行為的3W要素,即:誰在看(Who)、什么時間看(When)和看什么(What)。目前實行的收視率調查是建立在一套被行業內認可的、完整的技術和運維方案基礎上的,在采集到觀眾收看電視節目的3W相關變量后,進行統計計算和報告而得到的最終結果,這也是收視率數據能夠成為行業通用貨幣的基礎。因此,在采用大數據生產收視率過程中,也必須建立一種科學的流程思維,并在這種思維指導下形成一套科學的大數據采集流程。
在當前電視生態系統范疇內,能與收視率產生聯系形成大數據集的數據多種多樣,包括電視機頂盒和基于移動終端視頻消費的回路數據、社交媒體上視頻分享和討論的數據,以及與在線視頻服務有關的ISP 服務器后臺數據等各種與視頻相關的數據,如何把這些大數據轉化和生產成收視率數據,還需要增加一些必須的手段和環節。