傳統出版業真的存在“大數據”嗎?經過張立多方查證研究發現,“大數據”與傳統出版業的關系其實不大,“如果結合 過去兩年產生的數據占人類歷史數據總量的90% 的說法,傳統出版業的整體數據量在比較中顯得更小。2014年出版的全部書刊報的內容總量僅為GB級,幾張藍光光盤就刻完了。”
張立認為,與互聯網的草根生產內容模式不同,出版業的精英生產內容模式導致了其難以套用大數據分析,“精英生產內容具有嚴格的內容評價與篩選機制,如 三審制 等,使傳統出版物具有較高的價值含量和較集中的知識屬性,與互聯網上的口水性內容不可同日而語。”
現在動輒是“大數據”、“云出版”、“知識庫”,這些名稱看似時髦又高大上,出版單位現有的數據規模和數據特點是否真的需要建設大數據平臺并以此來指導運營?“如果求一個長方形面積,長乘寬就夠了,何必非要使用微積分呢?”張立認為這是在為轉型而轉型。另一方面,傳統出版物的內容數據需要擅長內容挖掘的軟件進行智能化處理,而此類軟件更多的還處于探索階段,這也造成了大數據難以在傳統出版發行領域大施拳腳。
然而無論如何,大數據已成為時代發展趨勢,出版發行業難免會被裹挾其中,無法“獨善其身”,且大數據在出版發行領域的一些方面還是可以有所作為的,“比如今年大獲成功的基于個性化推薦的新聞資訊類內容,如果出版單位想要進行選題策劃,以大數據的方式分析市場需求和潛在用戶是不錯的選擇。”怎樣將大數據為己所用?張立表示出版業需要更多理性思考,“出版單位建設大數據平臺要從企業轉型和業務實際出發,如果是做線裝書出版,為什么非要去開發電子版呢?有時候堅守傳統不是固步自封,而是不做無謂的噱頭。”