導(dǎo)讀:自2012年底起,“大數(shù)據(jù)”吸引了越來(lái)越多的關(guān)注,成了被廣泛討論的概念之一。出版業(yè)尚未在“數(shù)字出版”對(duì)“傳統(tǒng)出版”的沖擊中摸清門徑,就一下次又被推到了“大數(shù)據(jù)出版”的浪潮之前。大數(shù)據(jù)到底是什么?它會(huì)如何影響傳統(tǒng)出版,帶來(lái)怎樣的思維方式和商業(yè)模式的變革?它又會(huì)給我國(guó)傳統(tǒng)出版業(yè)帶來(lái)哪些問題和挑戰(zhàn)?這些問題值得傳統(tǒng)出版業(yè)中的有識(shí)之士認(rèn)真思考。
何謂“出版業(yè)大數(shù)據(jù)”
為了更清晰地認(rèn)識(shí)出版業(yè)大數(shù)據(jù)的面貌,國(guó)家新聞出版廣電總局?jǐn)?shù)字出版司對(duì)出版業(yè)大數(shù)據(jù)進(jìn)行模型構(gòu)建,整體分為五個(gè)層面,由內(nèi)而外分別是核心層、產(chǎn)品層、業(yè)務(wù)層、市場(chǎng)層和用戶層。
核心層即出版生產(chǎn)過程中產(chǎn)生的各種內(nèi)容資源數(shù)據(jù);產(chǎn)品層是指產(chǎn)品信息的基礎(chǔ)數(shù)據(jù),目前以書目信息為主;業(yè)務(wù)層是指出版產(chǎn)品流通的數(shù)據(jù),記錄著整個(gè)出版業(yè)務(wù)運(yùn)行狀態(tài)的信息;市場(chǎng)層和用戶層分別包括產(chǎn)品消費(fèi)數(shù)據(jù)和消費(fèi)反饋數(shù)據(jù),記錄了廣大用戶的行為數(shù)據(jù)和評(píng)價(jià)信息。這種劃分從宏觀層面可以更好地理解出版業(yè)大數(shù)據(jù)的發(fā)展整體狀況,對(duì)制定大數(shù)據(jù)扶持政策、推動(dòng)大數(shù)據(jù)發(fā)展具有積極的作用。
“大數(shù)據(jù)”對(duì)傳統(tǒng)出版業(yè)的影響
無(wú)論國(guó)內(nèi)還是國(guó)外,業(yè)界普遍接受這樣一種論斷,從選題策劃到出版發(fā)行,出版業(yè)的每一個(gè)環(huán)節(jié)都離不開大數(shù)據(jù)。那么大數(shù)據(jù)究竟會(huì)對(duì)傳統(tǒng)出版業(yè)帶來(lái)哪些影響?
具體來(lái)說(shuō),在選題策劃環(huán)節(jié),過去出版社在出版一本書之前,先是基于經(jīng)驗(yàn)判斷,然后往往會(huì)經(jīng)過市場(chǎng)調(diào)研,以了解市場(chǎng)需求,在這種情況下,出版人對(duì)經(jīng)驗(yàn)判斷的依賴度較高,而在高節(jié)奏的社會(huì)發(fā)展背景下,市場(chǎng)需求變化瞬息萬(wàn)變,單純依據(jù)經(jīng)驗(yàn)進(jìn)行判斷的風(fēng)險(xiǎn)度急劇加大,比如今年有眾多出版社針對(duì)美國(guó)總統(tǒng)大選所進(jìn)行的選題儲(chǔ)備,就出現(xiàn)了大面積的誤判現(xiàn)象。在大數(shù)據(jù)尚未建立的情況下,市場(chǎng)調(diào)研往往采用隨機(jī)抽樣問卷調(diào)查的形式。隨機(jī)抽樣式調(diào)查固然有一定的科學(xué)性和可參考性,但其數(shù)據(jù)支撐的天然缺陷是始終存在的。這也是為什么傳統(tǒng)出版業(yè)的出版品種在逐年遞增的原因:為了應(yīng)對(duì)市場(chǎng)需求的不確定性,出版企業(yè)往往需要生產(chǎn)過剩的文化產(chǎn)品,再重點(diǎn)推廣其中某些產(chǎn)品,以期望這些產(chǎn)品能夠滿足消費(fèi)者的需求。很顯然,這種傳統(tǒng)的生產(chǎn)模式不僅增加了成本,還造成了一定程度上的資源浪費(fèi)。
在大數(shù)據(jù)時(shí)代,一個(gè)題材的書籍是否有必要發(fā)行,不再是過去那種“經(jīng)驗(yàn)式”的決策方式,而應(yīng)該是在一定數(shù)據(jù)統(tǒng)計(jì)下,經(jīng)過分析后得出的可供參考的,相對(duì)客觀的預(yù)測(cè)結(jié)論。通過大數(shù)據(jù)分析,可以更實(shí)時(shí)、準(zhǔn)確、小成本地分析現(xiàn)有市場(chǎng)的潛在需求和趨勢(shì)。這樣,出版社不必再忙于傳統(tǒng)市場(chǎng)調(diào)研的隨機(jī)抽樣問卷調(diào)查,也不必再受制于調(diào)查得出的滯后的市場(chǎng)數(shù)據(jù),更不必再通過過剩生產(chǎn)的方式來(lái)滿足受眾需求。出版社通過對(duì)用戶數(shù)據(jù)的分析,可以了解到用戶的產(chǎn)品偏好,這樣就可以相對(duì)定向地策劃、生產(chǎn)出符合用戶潛在需求的文化產(chǎn)品。出版社可以和掌握相關(guān)用戶數(shù)據(jù)的網(wǎng)站合作,分析用戶使用搜索和“想讀”功能而積累起的海量數(shù)據(jù),從中挖掘出用戶的偏好趨勢(shì)和書籍市場(chǎng)的潛在需求。社交網(wǎng)站和搜索引擎也掌握著龐大的數(shù)據(jù)。出版社可以通過對(duì)微博上與書籍相關(guān)的關(guān)鍵詞進(jìn)行排序,挖掘出近期熱門的內(nèi)容題材和作家。
在印量確定環(huán)節(jié),基于數(shù)據(jù)的分析,例如該類書的市場(chǎng)受歡迎程度、作者受歡迎程度、已出版同類書籍的銷售庫(kù)存情況,也可以大概推測(cè)出這本書的首印量應(yīng)該為多少。新書首印量的確定不僅關(guān)系到出版社的贏利,更關(guān)系到成本控制,相對(duì)于印少了來(lái)說(shuō),印多了不僅不能創(chuàng)造預(yù)期的利潤(rùn),更會(huì)增加不該有的庫(kù)存,占用大量資金,因此對(duì)新書首印量的數(shù)據(jù)性分析有助于首印數(shù)的決策參考。
在圖書營(yíng)銷環(huán)節(jié),大數(shù)據(jù)可利用的范圍就更加廣闊,為圖書提供了精準(zhǔn)營(yíng)銷的可能性,在運(yùn)用大數(shù)據(jù)之前,對(duì)讀者的閱讀喜好調(diào)查多為抽樣調(diào)查,而大數(shù)據(jù)可以通過對(duì)數(shù)據(jù)的分析和計(jì)算,如某地讀者的閱讀喜好與習(xí)慣、不同省份更喜愛的書籍類型,哪些書籍放在一起容易捆綁銷售等這些用戶行為,分析出讀者的需求和喜好,更好地進(jìn)行推銷。通過對(duì)這些信息的收集、加工和整理,就可以得到有意義的統(tǒng)計(jì)規(guī)律。社交網(wǎng)站上的用戶關(guān)系也可用于大數(shù)據(jù)分析。利用社會(huì)網(wǎng)絡(luò)分析法對(duì)社交網(wǎng)站用戶間關(guān)系進(jìn)行分析,可以辨別出有著不同屬性、興趣愛好和消費(fèi)能力的“小圈子”。這些小圈子就是典型的細(xì)分的目標(biāo)市場(chǎng)。專業(yè)出版物往往只符合小眾市場(chǎng)的需求,而在這些小圈子進(jìn)行專業(yè)出版物的營(yíng)銷活動(dòng),利用社交網(wǎng)絡(luò)強(qiáng)關(guān)系和弱關(guān)系的連結(jié),可以取得良好的營(yíng)銷效果。在大數(shù)據(jù)分析的幫助下,對(duì)不同的用戶進(jìn)行定向的新書推薦和廣告投放,也可以使?fàn)I銷更有效、更富有針對(duì)性。
大數(shù)據(jù)的思維不僅僅可能影響傳統(tǒng)出版業(yè)的各個(gè)產(chǎn)業(yè)鏈環(huán)節(jié),還可能為出版社提供新的商業(yè)贏利模式。在傳統(tǒng)出版業(yè),出版是主要環(huán)節(jié),帶動(dòng)其他環(huán)節(jié)形成出版業(yè)的生產(chǎn)鏈條。在大數(shù)據(jù)時(shí)代,數(shù)據(jù)本身就是重要的資產(chǎn)。這種資產(chǎn)就像冰山一角,沒有深入挖掘就不能發(fā)現(xiàn)其潛藏的巨大價(jià)值。出版社需要認(rèn)識(shí)到,自身所擁有的龐大內(nèi)容資源,本身就可以是一個(gè)巨大的數(shù)據(jù)庫(kù)。谷歌于2010年推出的圖書數(shù)據(jù)庫(kù)就包括了從1500年到2008年間出版的各類圖書的5000億個(gè)單詞,大約有2000萬(wàn)圖書被掃描成了數(shù)字圖書。用戶可以在電腦上輸入單詞,查看這些單詞歷年的使用頻率。這樣的數(shù)據(jù)庫(kù)對(duì)于人文社科研究有著巨大的價(jià)值。
除去傳統(tǒng)出版的環(huán)節(jié),對(duì)數(shù)字出版來(lái)說(shuō),大數(shù)據(jù)也很有用處。大數(shù)據(jù)為按需出版提供了數(shù)據(jù)支持,出版社可根據(jù)讀者的用戶行為、偏好取向等進(jìn)行全面分析,將有可能實(shí)現(xiàn)真正意義上的個(gè)性化定制內(nèi)容和按需出版。
國(guó)際出版業(yè)的實(shí)踐
全球領(lǐng)先的學(xué)術(shù)科技期刊和專著出版商施普林格通過大數(shù)據(jù)提升決策效率。施普林格目前在世界25個(gè)國(guó)家和地區(qū)擁有超過6000名員工,共出版發(fā)行了2000多種學(xué)術(shù)期刊和12.3萬(wàn)種學(xué)術(shù)專著。施普林格借助大數(shù)據(jù)分析,發(fā)現(xiàn)全球?qū)W術(shù)、科研、政府、企業(yè)機(jī)構(gòu)對(duì)期刊形式的需求發(fā)生了重大變化,結(jié)果顯示多達(dá)88%的機(jī)構(gòu)只需要數(shù)字期刊,只有12%的機(jī)構(gòu)表示仍需要紙質(zhì)期刊。于是施普林格察覺到了從紙質(zhì)出版向數(shù)字出版發(fā)展的巨大變化,它借助分析結(jié)果進(jìn)行決策,加速整個(gè)公司數(shù)字化出版的進(jìn)度。
世界著名的大眾圖書出版商西蒙·舒斯特十分重視大數(shù)據(jù)技術(shù)的應(yīng)用,聘請(qǐng)了著名的數(shù)據(jù)科學(xué)家直接指導(dǎo)社內(nèi)大數(shù)據(jù)應(yīng)用項(xiàng)目開展,并借助底層數(shù)據(jù)架構(gòu)為大數(shù)據(jù)項(xiàng)目實(shí)施提供基礎(chǔ),借助大數(shù)據(jù)優(yōu)化業(yè)務(wù)管理和拓寬業(yè)務(wù)范圍。通過對(duì)讀者購(gòu)書和閱讀行為數(shù)據(jù)進(jìn)行全面收集,對(duì)數(shù)據(jù)進(jìn)行大數(shù)據(jù)分析,從而發(fā)現(xiàn)這些數(shù)據(jù)背后的意義,可以分析得出為什么人們喜歡某個(gè)作者;通過大數(shù)據(jù)技術(shù)對(duì)銷售渠道產(chǎn)生的數(shù)據(jù)進(jìn)行分析,制定了更優(yōu)的定價(jià)策略,并且還可獲知在何種情況下對(duì)圖書銷售可能會(huì)造成何種影響;通過大數(shù)據(jù)分析還發(fā)現(xiàn)了通過在線社區(qū)和社交媒體宣傳和銷售以吸引讀者關(guān)注圖書的新模式,并可獲知讀者亟需內(nèi)容的類型。
亞馬遜利用大數(shù)據(jù)改變營(yíng)銷方式的案例也值得借鑒。作為在線售書商,亞馬遜曾經(jīng)專門成立了一個(gè)由20多名書評(píng)家和編輯組成的團(tuán)隊(duì)。這個(gè)團(tuán)隊(duì)通過撰寫書評(píng)、推薦新書的形式,承擔(dān)起傳統(tǒng)評(píng)論人的角色,對(duì)書籍銷量產(chǎn)生了巨大的影響。然而,當(dāng)亞馬遜意識(shí)到數(shù)據(jù)的作用后,通過對(duì)用戶的大數(shù)據(jù)分析,建立起亞馬遜的購(gòu)書推薦系統(tǒng)。這個(gè)系統(tǒng)能夠自動(dòng)向用戶推薦經(jīng)數(shù)據(jù)分析后其最有可能會(huì)買的書籍,最終,推薦系統(tǒng)獲得了比書評(píng)團(tuán)隊(duì)更好的效果,書評(píng)團(tuán)隊(duì)也走向解體。
如果出版社擁有自己的電子閱讀器用戶,那么出版社就可以對(duì)電子閱讀器用戶的閱讀習(xí)慣和閱讀行為進(jìn)行量化。巴諾書店利用自己的Nook電子閱讀器收集用戶的閱讀行為數(shù)據(jù)。通過數(shù)據(jù)分析,巴諾發(fā)現(xiàn)非小說(shuō)的閱讀,尤其是篇幅較長(zhǎng)的書的閱讀,總是斷斷續(xù)續(xù),往往容易較早被放棄。這些數(shù)據(jù)促使巴諾推出“Nook快照”,加入了從減肥到“占領(lǐng)華爾街”運(yùn)動(dòng)等一系列與健康和時(shí)事有關(guān)的短小作品,鼓勵(lì)讀者閱讀非小說(shuō)類作品和長(zhǎng)篇的新聞作品。甚至,數(shù)據(jù)還能幫助出版社在電子書中合適的地方加入多媒體功能,讓讀者繼續(xù)保持興趣。出版社還能通過讀者的閱讀速度或放棄閱讀的比例來(lái)判斷讀者對(duì)此書是否還有興趣。
“大數(shù)據(jù)”對(duì)出版業(yè)的真正意義
有關(guān)數(shù)字出版對(duì)傳統(tǒng)出版的挑戰(zhàn)與機(jī)遇的論述已經(jīng)有許多,觀點(diǎn)也普遍被業(yè)界所接受。但大數(shù)據(jù)時(shí)代的來(lái)臨對(duì)出版業(yè)究竟意味著什么?
美國(guó)學(xué)者舍恩伯格曾經(jīng)舉過Google圖書館的例子來(lái)說(shuō)明數(shù)字出版和大數(shù)據(jù)出版的差異:前者只是將書本內(nèi)容搬到了計(jì)算機(jī)和因特網(wǎng)上供人查閱,而后者則是通過光學(xué)識(shí)別軟件將書本中的內(nèi)容轉(zhuǎn)化為計(jì)算機(jī)可以檢索和運(yùn)算的信息,從而將所有文獻(xiàn)內(nèi)容集成為一個(gè)大數(shù)據(jù)庫(kù),借助計(jì)算機(jī)可以對(duì)其中的任何文本進(jìn)行挖掘和分析??梢姡瑪?shù)字出版的歷史進(jìn)步性在于對(duì)信息存儲(chǔ)、復(fù)制和傳播方式的變革,但數(shù)字出版所沒有解決的,是對(duì)信息的挖掘和運(yùn)算問題——而這正是大數(shù)據(jù)出版最關(guān)注的核心價(jià)值:在沒有數(shù)據(jù)化之前,所有數(shù)字出版的產(chǎn)品無(wú)法被集成和參與運(yùn)算;而實(shí)現(xiàn)了大數(shù)據(jù)出版之后,這些信息孤島就被海底的大陸架所連接,雖然其呈現(xiàn)方式可以是一本本書籍,但其內(nèi)在結(jié)構(gòu)卻是一個(gè)可被分析的大數(shù)據(jù)庫(kù)。大數(shù)據(jù)技術(shù)的戰(zhàn)略意義不在于掌握龐大的數(shù)據(jù)信息,而在于對(duì)這些含有意義的數(shù)據(jù)進(jìn)行專業(yè)化處理。
大數(shù)據(jù)對(duì)傳統(tǒng)出版業(yè)來(lái)說(shuō)更大的價(jià)值不在于技術(shù)本身,而在為出版業(yè)提供一種思維方式和思考模式,大數(shù)據(jù)強(qiáng)調(diào)相關(guān)關(guān)系,重視總體數(shù)據(jù),寬容數(shù)據(jù)中的“噪音”,實(shí)時(shí)地發(fā)現(xiàn)其中從未被了解過的相關(guān)性現(xiàn)象和趨勢(shì),挖掘并創(chuàng)造意想不到的價(jià)值,改變了傳統(tǒng)數(shù)據(jù)時(shí)代一味追求因果關(guān)系和精致化數(shù)據(jù)處理的思維習(xí)慣。