信息技術正飛速發展,互聯網已被普及利用,各種終端設備記錄了人類社會復雜頻繁的信息行為,從而產生了驚人的數據量。在大數據時代,數據分析被提升到了前所未有的高度。這無疑會給社會科學文獻情報研究帶來巨大的挑戰,同時也使它迎來了重要的發展契機。本文對大數據分析和社會科學文獻情報研究的關系進行對比研究,同時對大數據環境下社會科學文獻情報研究的發展趨勢進行展望。
大數據分析(Big Data Analytics,BDA)是指對大數據進行分析,從中找出可以幫助決策的隱藏模式、未知的相關關系以及其他有用信息的過程。大數據分析方法眾多,有些適合社會科學文獻情報研究,有些不適合社科文獻情報研究,其中數據挖掘方法與社科文獻情報研究關系最為密切。
大數據分析與情報研究都是對數據和信息進行分析研究,把研究成果提供給用戶,其工作過程幾乎完全一致。因此,兩者之間存在著許多共性。但是,由于兩者產生于不同的時代,科學技術、社會發展的背景導致了兩者之間又存在不少的差異性。總之,大數據分析與社會科學文獻情報研究既有聯系又有區別。
大數據分析與社會科學文獻情報研究的共性主要表現在三個方面:看重對數據的定量分析、關注多源數據融合,以及強調相關性分析。大數據的基礎和社會科學文獻情報研究的基礎一致,都是數據。大數據的特點是數據量大、種類多、價值低、速度快。大數據分析是采用一系列技術方法對各種數據進行定量分析,從而達到去粗取精、化繁為簡、沙里淘金的目的。社會科學學科之間相互交叉滲透,新學科不斷涌現,傳統學科越分越細,使得社科情報研究面對的數據量越來越大。傳統的社會科學文獻情報研究單靠人力已經無法勝任。使用新方法、新技術對數據進行定量分析成為必然。使用定量分析是社會科學文獻情報研究與大數據分析之間最為突出的一個共性。關注多源數據融合是社會科學文獻情報研究與大數據分析之間的又一個共性。大數據環境下,數據的來源越來越多。只靠一兩個來源完成分析研究是不可能的,研究的結果必然是片面的,甚至是錯誤的。只有把各種來源的數據進行融合,才能保證其分析研究的準確性和科學性。此外,大數據分析與社會科學文獻情報研究都強調相關性分析,這也是兩者間的共性之一。
大數據分析與社會科學文獻情報研究的差異性主要表現在四個方面。數據對象方面:大數據分析以數值信息為主,社會科學文獻情報研究則以文本信息為主。數據規模方面:大數據分析是大而全,而社會科學文獻情報研究是適度數據,突出關鍵。分析任務方面:大數據分析強調挖掘新模式,社會科學文獻情報研究卻任務明確、模式既定。分析時機方面:大數據分析采用實時分析,而社會科學文獻情報研究分析有時滯。
總之,大數據分析是社會科學文獻情報研究的一個組成部分,是社會科學文獻情報研究所必須掌握和使用的技能之一,是社會科學文獻情報研究的前期準備工作,是社會科學文獻情報研究的一個重要工具。
大數據環境下情報研究面臨新環境,主要是面對新的研究對象、新的研究方法和工具。大數據環境下情報研究的對象是全新的,新就新在數據量更加巨大,數據形式、數據來源更加多樣化,非結構化數據成為情報研究新的對象。
大數據環境下情報研究的方法和工具也是全新的。在情報搜集和獲取方面,傳統的方法和工具遇到了性能瓶頸;在數據組織方面遇到了如何將復雜數據轉化為簡易數據的問題;數據分析更加抽象,其計算量呈指數級上升。傳統的情報研究方法和工具已不能適應新的情況,新的方法和工具應運而生。傳感技術、互聯網技術、大規模存儲技術、云計算技術成為了情報研究新的工具。而數據挖掘方法、社會網絡分析方法等已成為情報研究新的方法。
當前大數據環境下社科文獻情報研究發展有三方面的新趨勢。一是對新型數據源加以分析研究和綜合利用。在大數據環境下新型信息資源不斷涌現,種類繁多。這就要求社會科學文獻情報研究必須加強對新型信息資源的分析研究,并對種類繁多的新數據源加以綜合利用。二是大數據環境下,數據、信息分析的新技術、新方法層出不窮。社會科學文獻情報研究必須引進新技術、使用新方法。三是大數據時代,社會發展、經濟發展、科技發展一體化的程度越來越高。社會科學各學科之間,社會科學與自然科學之間各學科交叉、融合,許多學科越分越細、新學科不斷涌現。這就要求社會科學文獻情報研究拓展和深化其領域,不同領域之間在方法和視角上要相互借鑒,不同學科、不同研究機構間要加強協作。
面對新形勢新問題,社會科學文獻情報研究積極謀求應對之道。首先,轉變觀念。在大數據時代,傳統的社會科學文獻情報研究觀念必須轉變。只有轉變觀念,才能與時俱進,開拓社會科學文獻情報研究的新局面。其次,借鑒方法。大數據時代來臨,產生了許多新的數據分析方法,很多值得社會科學文獻情報研究借鑒。其中數據挖掘、知識發現、海量數據的基本統計分析方法尤為重要。再次,引進技術。大數據時代,計算機技術、數據庫技術都取得了飛躍式的進步。引進技術勢在必行。最后,培養人才。大數據時代,社科情報研究人員必須掌握和熟練運用上述新的方法和新的技術。人才培養迫在眉睫,這也是社會科學文獻情報研究的當務之急。
20世紀50年代情報學是在信息大爆炸背景下誕生的。隨著科技進步與社會發展,大數據時代來臨是歷史的必然。歷史賦予了社會科學文獻情報研究新的使命,帶來了新的機遇。