隨著移動互聯網、物聯網、云計算等新興技術的發展,社交媒體、智能終端和視頻監控等媒介設施迅速普及,全球數據量呈爆炸性增長。據國際數據公司(IDC)統計,僅2011年全球被創建和復制的數據量即達1.8ZB,相當于有史以來所有印刷材料數據量的近萬倍,而這樣龐大的數據量每兩年將翻一番。海量數據蘊涵著高昂價值,運用新興技術整合數據已成為惠普、IBM、微軟、阿里巴巴等國際巨頭戰略轉型的重要規劃之一。著名咨詢公司麥肯錫2011年發布名為《大數據:下一個創新、競爭和生產率的前沿》的研究報告,認為數據已經滲透到了每個行業和業務職能領域,逐漸成為重要的生產要素,對海量數據的運用,預示著新一波生產率增長和消費者盈余浪潮形成。2012年3月,美國政府發布了“大數據研究與開發計劃”,將之列為繼“信息高速公路計劃”之后的又一重大科技發展部署。種種現象表明,大數據時代已經來臨。
大數據時代,任何產業和企業組織都面臨著新一輪的機遇和挑戰。由于大數據與互聯網及網民的天然接近性,IT業和營銷行業首當其沖。在出版領域,圖書電商是以IT身份而從事營銷業務的典型代表,如何直面挑戰、乘機求進,不僅事關其自身發展,也與整個出版業未來發展方向息息相關。
大數據的定義、特征與內涵
根據麥肯錫的定義,“大數據”是指無法在一定時間內用傳統數據庫軟件工具對其內容進行抓取、管理和處理的數據集合。之所以“無法”抓取、管理和處理,緣于大數據的四個基本特征。其一,數據量巨大。數據量級已經從GB(千兆字節)和TB(萬億字節)發展到了PB(千萬億字節)、EB(百億億字節)乃至ZB(十萬億億字節)計量的地步。科學家估算,如果將2013年全球存儲的數據刻錄在只讀光盤上,可以堆成五堆,每一堆都伸向月球。其二,數據類型多樣。除少量由傳統數據庫累積的結構化數據之外,還包括各類互聯網、物聯網應用所產生的文字、圖片、視頻、圖像與地理位置信息等半結構化和非結構化數據,后者占比達75%以上。[1]其三,實時快速。數據快速產生、增長和流轉,例如即時通訊工具中產生的數據流,要求實時存儲和處理,如果事后追溯則價值流失。其四,價值高但密度低。大數據包含著大量冗余信息,必須披沙揀金才能有所獲益。例如,社交網站中多數日常交流信息價值稀薄,但聯合國的“全球脈動計劃”在巨量日常信息的基礎上,使用自然語言解密軟件對網民進行“情緒分析”,可以預測失業率、疾病爆發等現象,有益于經濟和社會發展。
原本“無法”抓取、管理和處理的數據集合,如今得以愈來愈多地運用,這是大數據時代的意義所在。因而,“大數據”的內涵,不僅止于“龐大的數據集合”,而且包含對數據的存儲、處理、分享、挖掘、分析等技術與能力。大數據技術中,社交網站、物聯網的應用,使用戶的行為軌跡、情緒變化以至萬事萬物的所處狀態都可以數據化;以Hadoop(能夠對大數據進行分布式處理的軟件框架)為代表的非關系型數據庫系統使不同行業、不同類型數據之間的聯系、交換和利用更加便捷;云計算等分布式運算架構技術使快速、低成本分析巨量數據成為可能。大數據內涵的核心,事實上在于如何應用大數據。這正如《駕馭大數據》的作者BillFranks(比爾·弗蘭克斯)所說:“重要的不是數據,而是如何使用數據;大數據的核心是發現價值。”
大數據為圖書電商帶來機遇
圖書電商,如當當、卓越亞馬遜、京東商城以及各出版機構自設的網絡書店等,目前已經成為我國圖書銷售的主流渠道。但在激烈的市場競爭中,圖書電商普遍陷入價格戰和庫存量過高、物流成本過大的泥淖之中,自身發展受限,甚或對出版業生態構成損害。如何進一步提高營銷效率、拓展盈利,并擴大在出版領域的影響力,是圖書電商亟須解決的緊要問題。大數據在這些方面有著顯著的應用價值。
1.進行精準營銷
精準營銷是營銷主體將產品和服務等相關信息精確、準時傳遞給目標用戶,以提高營銷效率并降低成本的行為或過程。在傳統的“小數據”背景下,用戶數據相對匱乏,數據分析效率偏低,導致營銷的精度有限,不僅浪費了資源,而且推送的無效信息對用戶形成干擾,影響消費體驗。大數據時代,圖書電商的互動交易平臺本身具有多種功能,能夠對用戶點擊、瀏覽、評論、試讀、收藏、購買等行為進行數據記錄。用戶在微博、微信、QQ群等社交媒體上的所有網絡行為也都會留下“蹤跡”,形成包含個人信息的數據。圖書電商廣泛獲取此類數據,必要時進一步結合第三方交易平臺、數據服務機構提供的相關數據,進行歷時性分析、語義解讀等技術處理,就能夠全面了解用戶群體乃至個體的屬性、交易行為、社交關系圖譜等相關信息,挖掘其需求、偏好、習慣以至情緒特征,從而精確化、智能化地確定在何時、何渠道、以何種方式和終端推送信息和服務,找到具有實效、線路最短的營銷接觸點。
從產品的角度看,經大數據分析,營銷主體可以迅速找出哪些產品之間高度相關,用戶可能連帶購買,也可以發現某些產品具有高度替代性,用戶不可能同時購買,從而對營銷內容進行新的優化組合。在洞見產品與用戶的基礎上,無論是圖書推送、樣張試讀,還是廣告信息傳達,都將大大提高準確度和實效性。即使書評撰寫,也可以匯聚更多用戶自發生成的碎片化內容,再進行針對性組合和分發,提高其個性化和針對性,增強對目標讀者的說服力。據報道,亞馬遜現在完全可以運用大數據運算代替專業的書評人員來推薦圖書。[2]亞馬遜自稱,其銷售額的1/3都來自于它的個性化推薦系統。[3]借助大數據,亞馬遜創造了更為精準與美妙的用戶體驗,提升了效率與效益。
在大數據精準營銷模式下,圖書電商的庫存與運輸成本也將隨之降低。傳統營銷中主要依靠既往銷售數據和主觀經驗決定庫存量和運輸方式,其滯后性和誤差率推高了成本。大數據營銷以即時、全面的數據提高決策效率和精確度,甚至可以對某些區域短時段內的社會熱點、天氣變化、交通限制等問題作出預判,及時調整圖書存量與運輸方案,從而節約成本。亞馬遜基于大數據自行定義的自動補貨模型,有效地改善了完全依靠人工的訂貨、補貨模式,提升了庫存管理的效率。農夫山泉使用思愛普(SAP)公司研發的大數據系統HANA管理運輸網線,降低了35%的運輸成本。[4]基于大數據的科學、精準的營銷漸成趨勢,日益取代過去基于直覺的粗放式的營銷決策。
2.拓展盈利模式
圖書電商當前主要以圖書網絡發行兼及少量廣告為主要盈利模式。盈利模式單一,而市場空間有限,是行業內惡性競爭的重要原因。大數據時代,數據之于企業,不再是商業活動的附屬品,而是極其寶貴的核心資源,對之進行收集、分析、利用等任一環節都能創造出新的價值。2012年1月,瑞士達沃斯論壇發布名為《大數據,大影響》的報告,宣稱數據已經成為一種新的經濟資產類別,如同貨幣和黃金一樣。依托大數據,圖書電商有望拓展出多種盈利模式。[page] 其一,數據產品銷售。圖書電商依托互動交易平臺和微博、微信、論壇等社交媒體與成千上萬的用戶密切交流,具有收集用戶數據的便利條件。這些數據產生于以交易為主旨的深入的交流互動過程中,因而信息的價值含量更高。經廣泛收集、分類整理和重新聚合的數據集合,蘊涵著豐富的用戶及市場信息,對出版及相關行業具有極高的商業價值,具備銷售盈利的可能性。例如,百度通過搜集整理網絡游戲玩家的搜索熱點,建立網游用戶行為數據庫,銷售給網絡游戲運營商,獲得了不菲的盈利。這一模式堪稱“數據資產化”理念的直接體現。
其二,數據分析服務。基于大數據集合,圖書電商運用數理統計、數據挖掘、語義分析等科學方法,對隱藏于圖書流通、讀者行為、交易過程等數據背后的特點、規律、變動趨勢進行分析、判斷,將品牌美譽度、市場占有率、競爭對手狀態等分析結果定期提供給出版商等客戶,幫助其深入洞察市場變化,及時作出科學決策。例如,阿里巴巴2012年7月推出名為“聚石塔”的大數據分析平臺,為入駐用戶提供諸如買家訪問量、訪問頻率、商品與品牌偏好、跨店鋪點擊等數據及相關分析,為自身與用戶都帶來了巨大的商業利益。
其三,圖書電商也可以建成數據分析、分享、交易平臺,構建平臺強大的數據采集、存儲、運算、分析功能,為出版商等客戶提供策劃、營銷、決策等多方面服務,同時獲得相應的盈利。大數據時代,以利用數據價值為核心,新型盈利模式不斷涌現,圖書電商把握機遇、放寬視野,就能找到新的利潤增長點。這正如“大數據時代預言家”維克托·邁爾-舍恩伯格所說的:“數據的真實價值就像是漂浮在海洋中的冰山,第一眼只能看到冰山的一角,但是絕大部分隱藏在表面之下。”圖書電商應高度重視數據,進而去開掘冰山一樣無法估量的財富。
3.強化產業鏈優勢地位
在文化創意產業范疇中,出版產業鏈大致表現為“作者創意—內容策劃—生產制造—行銷推廣—衍生增值—用戶消費”的鏈條形態。根據“微笑曲線”原理,居于產業鏈兩端的企業能產生高附加值,利潤率最高,居于中間位置的企業利潤率最低。圖書電商歸屬于其中“行銷推廣”環節,產業鏈位置決定其盈利狀況不容樂觀。圖書電商近年來的發展成果主要應歸功于社會、產業的快速網絡化,而未來要進一步發展,則應借助新興的大數據技術調整自身在產業鏈中的地位。具體說來,圖書電商應適當涉足產業鏈高盈利環節,如創意策劃、衍生增值等,而大數據為其提供了可能。
大數據時代,圖書電商參與內容創意與策劃大有可為。當前條件下,多數圖書策劃是編輯人員依據行業經驗和對某一領域熱點的敏感度進行的,在讀者定位、作者水準、推出時機、市場需求量等方面往往存在偏差,影響圖書質量和市場效果。而在大數據條件下,圖書電商在互聯網營銷過程中能夠獲得大量用戶的交易數據和網絡應用數據,運用大數據智慧分析,能夠洞察用戶的閱讀需求,準確把握市場熱點,發掘有價值的選題,并以潛在讀者的視角遴選恰當的作者人選,規劃裝幀設計。如此一來,以數據引領策劃,以需求驅動生產,市場成功率可獲提高。圖書試讀也可作為完善策劃的一個環節。例如,亞馬遜新推出試用的產品,總會大量收集用戶的訪問、評論、購買、推薦等各種數據,Kindle電子書閱讀器里也會記錄哪些內容被反復閱讀和標記強調,經大數據智慧分析,能夠評估其問題所在、受歡迎程度,然后決定該如何修正。科學的策劃方案和修正意見,對作者和出版機構而言都極其重要,掌握這些寶貴信息的電商可以借此對產業鏈上游產生影響,或者達成合作。
值得一提的是,圖書創意與策劃機構有時也針對一些重大選題展開市場調查,但其準確度遠不及大數據分析。究其原因,傳統調查主要使用抽樣、問卷獲得的概括性數據或者既往的交易數據,以部分代替整體,必然存在一定的偏差。而完善的大數據系統所能收集的,除了這些結構化數據,還包括大量文字、圖片、音視頻等相關的非結構化數據,作為數據“整體”則更為準確。此外,大數據中包含的社會化媒體信息多屬于自發的思想和情緒流露,較之傳統調查中被動答問更為客觀,因而也更具參考價值。
在衍生增值環節,圖書電商可以圍繞大數據進行數據產品銷售、數據分析服務,或者建成數據分析、分享、交易平臺謀取增值。對此前文已經論及。總之,依憑貼近終端用戶這一核心優勢,充分重視應用大數據,圖書電商有望融入出版產業鏈兩端的高盈利區域,在自身發展的同時,對整個出版業產生更大的影響。
圖書電商面臨的挑戰
機遇總是伴隨著挑戰,當前圖書電商要有效利用大數據,首先要直面數據采集渠道受限的問題。大數據來源主要包括:①媒體數據,尤其是互聯網、社交媒體產生的數據;②企業的生產、銷售、管理等數據;③政府部門的產業政策、公共服務、稅收、財政等數據;④物聯網、各種傳感器及攝像頭產生的數據;⑤民眾個人、家庭留存的文字及音像數據。然而,目前政府信息的公開性不夠,開放的、公共的社會網絡環境還未形成,權威、可信的第三方數據統計機構缺位,使得很多數據難以獲得,影響大數據的完整性和綜合性。圖書電商在期待環境改善的同時,唯有盡可能充分地應用社交網站等網絡媒體,以合作、購買等方式獲得廣泛的外部數據,并使之與企業內部運營數據互聯互通,以擴大數據采集量,強化多源數據的彼此關聯與印證,為大數據分析打下較好的基礎。
其次,圖書電商必須大幅提高大數據分析與可視化呈現能力。大數據的意義不在于擁有龐大的數據量,而在于對之進行專業化分析以便應用。然而,“這種數據不同于以往傳統的問卷調查數據,它們更龐大、更復雜,而且通常是非結構性的”;“有些行業的數據涉及上百個參數,其復雜性不僅體現在數據樣本本身,更體現在多源異構、多實體和多空間之間的交互動態性,難以用傳統的方法描述與度量,處理的復雜度很大”。[6]因而,新興技術工具十分重要。麥肯錫名為《大數據:下一個創新、競爭和生產率的前沿》的研究報告列舉了26項適用于眾多行業的分析技術,包括A/B測試、關聯規則學習、聚類分析、眾包、遺傳算法、自然語言處理、神經網絡、模式識別、預測建模、情感分析等。圖書電商應搭建高性能的分析技術平臺加以融合使用。技術平臺的分析處理只是基礎,要從模棱兩可的數據中綜合信息并導出可理解的內容,更需要兼通技術、出版、營銷業務的高素養人才,才能將有價值的發現應用到營銷戰略規劃和具體運營之中。更進一步,大數據分析結果需要以簡明清晰、形象生動的方式予以呈現,才能便于理解,吸引用戶關注,枯燥的數據羅列和冗長的報表不利于數據產品等衍生增值方式推廣。這就需要運用數據可視化技術,涉及計算機圖形學、虛擬現實技術、動畫技術等。而無論數據分析師還是數據可視化人才,當前都很缺乏。新型技術升級與人才培養相結合,真正提升大數據分析與呈現能力,是圖書電商面臨的緊要任務。
另外,數據安全、隱私保護也是圖書電商在大數據時代面臨的問題。在大數據采集、分析和應用過程中,必然涉及個體用戶的性別、年齡、地址、收入、消費偏好、行為特點等信息,大數據的強大功能甚至能獲取一些企業、機構的未公開信息,如管理不當,將對社會和自身帶來嚴重的負面影響。美、英等50多個國家和地區已經以法律形式規范了個人信息數據的管理與使用,如美國的《消費者隱私保護法》、歐盟的《關于個人數據自動化處理之個人保護公約》等,而我國尚未出臺類似的法律。[7]這種現狀雖然在短期內有利于大數據應用和相關探索,但從長遠看,用戶個體出于對隱私安全的擔憂和防范,會減少供給真實信息,從而造成大數據中冗余成分過多,阻礙其健康發展。另外,法律邊界模糊,也容易引發爭端。因而,在法律暫時缺位的環境中,圖書電商應遵循基本的商業倫理,尊重用戶隱私權,在具體操作中制定恰當的企業、行業規則,注意技巧和方法,不因商業利益對用戶造成傷害,以期獲得長遠價值。
總之,大數據時代已經到來,圖書電商應盡快更新觀念,從戰略的高度把握這一機遇。從現在開始,重視各類用戶數據的采集、整理、分析和應用,以之為中心,重構業務流程和組織結構,提高對用戶需求的感知能力和響應速度。隨著大數據環境日益成熟,駕馭大數據的能力逐步提升,圖書電商有望在新時代續寫華章。