每逢高考季,“三年模擬五年高考”豪華大禮盒便日漸失寵,而各種自詡命中率奇高的“押題”“猜題”則倍受青睞,家長學生們寧可信其有不愿信其無地趨之若鶩。而今年高考前后最熱的押寶,就是百度大數據對高考作文預測了,高考剛結束就被封為“神預測”。
百度高考作文預測,基于海量作文范文和搜索數據,利用概率主題模型,預測2014年高考作文的命題方向。在百度預測界面的高考作文預測選項,百度給出了六大作文命題方向,分別由六大色塊表示,并賦予權重以及關鍵詞,最終呈現為蜂窩狀的圖示。
預測的六大作文類別分別是:時間的饋贈、生命的多彩、民族的變遷、教育的思辨、心靈的堅守、發展的困惑,其中排名第一的“時間的饋贈”的出題概率顯示為28.61%,關鍵詞為“記憶”、“不再”、“未來”、“成長”、“依舊”、“忘記”、“歲月”和“無奈”,每一個關鍵詞又有對應的作文題示例,點擊這些示例關鍵詞,則可搜索到相關范文和素材。
今年高考,廣東省作文題中的關鍵詞包括照片、時代、記憶等,恰恰就符合了大數據中最熱門的“時間的饋贈”類別中的關鍵詞。
但是僅就多份考卷中幾個關鍵詞的“擦邊球”,還不足夠證明其準確性,尤其詞匯的寬泛和常見性,也使得“神預測”的說法略顯言過其實。
而且,對于文化產業,大數據可能只是能夠提供方法和養分的土壤,而絕對不是有獨創能力的藝術家。美國一家數據解決方案公司的CEO蓋瑞·垂尼克稱:如今,人們對大數據的狂熱就像野火一樣席卷了整個世界。心理學有一個術語叫“集體歇斯底里”,指的是一種癥狀或者一系列癥狀在多人之間迅速傳播,卻找不到合乎常理的解釋。他認為,是這種“集體歇斯底里”引爆了大數據市場。
正是這種對大數據的狂熱,使人們盲目地認為大數據無所不能,可以再任何領域顯神通,尤其是國外《紙牌屋》以及國內《屌絲男士》等基于大數據制作的視頻劇的空前成功,甚至使得部分人相信大數據可以在文化藝術領域制造出奇跡。
但文化藝術的最根本的獨創性、主觀性以及引領性卻在大數據的沖擊下被忽略。大數據畢竟只是技術,模塊化的生產和加工無法取代原創的作品。如果商家在嘗到大數據制作的甜頭后,開啟大規模的粗制濫造,更會使得原創力被扼殺,文化產業陷入一種缺乏活力、千篇一律的境地。
由大數據引發的新的營銷革命的確具有顛覆性,而且逐步走向成熟,但是在文化領域,大數據的“神話”應被冷靜對待,無論是高考作文題目此類小的切入點,還是將來會出現的其他可能,人們都應該認清大數據都只是一種輔助手段,背后最終還是以人的能動性為主導。