新世紀(jì)以來,信息和數(shù)據(jù)呈爆炸性增長態(tài)勢,世界進(jìn)入大數(shù)據(jù)時代。按信息單位計算,現(xiàn)在全世界每天發(fā)送的數(shù)據(jù)量達(dá)40億個或更多,我們的數(shù)字世界已擁有超過1.8萬億吉比特的數(shù)據(jù),并且仍將以每年40%以上的速度增長。大數(shù)據(jù)正在通過各種方式對人類經(jīng)濟(jì)社會發(fā)展的各個領(lǐng)域產(chǎn)生重要影響。
隨著數(shù)據(jù)量的高速增長,數(shù)據(jù)的內(nèi)在價值日益受到關(guān)注。數(shù)據(jù)量激增已經(jīng)給各行各業(yè)帶來深刻影響,以數(shù)據(jù)為研究基礎(chǔ)的社會科學(xué)也不例外。目前,雖然文獻(xiàn)的知識本質(zhì)并沒有隨時代的變化而變化,但其符號、載體和記錄復(fù)制方式正在發(fā)生翻天覆地變化;電子形式或網(wǎng)絡(luò)空間中的文獻(xiàn)正在向綜合化方向發(fā)展,數(shù)字化、多媒體、可視化等正在成為文獻(xiàn)記錄、保存和傳播的發(fā)展方向。面對這種形勢,社會科學(xué)的研究方法、研究內(nèi)容和學(xué)科疆界也在發(fā)生變化。在這一進(jìn)程中, 我們面臨的一個突出問題就是數(shù)據(jù)和信息的質(zhì)量及其管理。雖然大數(shù)據(jù)無處不在,但社會科學(xué)研究者能夠利用的畢竟只是其中極小一部分。一方面是數(shù)據(jù)和信息資源的數(shù)量無限增長,另一方面是人類對這些海量數(shù)據(jù)和信息資源的認(rèn)知與利用能力還遠(yuǎn)遠(yuǎn)跟不上;一方面是有用資源具有明顯稀缺性,另一方面又存在大量低質(zhì)量的冗余信息。在海量數(shù)據(jù)和信息面前,如果沒有數(shù)據(jù)管控,沒有數(shù)據(jù)和知識挖掘、發(fā)現(xiàn)、組織、導(dǎo)航、表達(dá)的科學(xué)化管理過程,科研人員就有可能迷失在數(shù)據(jù)和信息的汪洋大海中。
當(dāng)前,數(shù)據(jù)管控已成為學(xué)術(shù)研究尤其是社會科學(xué)研究中一個極為重要的問題。只有通過數(shù)據(jù)管控,加強(qiáng)對數(shù)據(jù)特別是分布式數(shù)據(jù)的觀察和管理,充分利用網(wǎng)格計算等信息技術(shù)來搜集、加工、整合、共享及傳播相關(guān)數(shù)據(jù),才能達(dá)到數(shù)據(jù)和知識利用的精準(zhǔn)化、科學(xué)化和最大化。比如,知識發(fā)現(xiàn)軟件工具可以幫助社會科學(xué)研究者從結(jié)構(gòu)化數(shù)據(jù)或非結(jié)構(gòu)化的復(fù)雜數(shù)據(jù)中提取有用和便于理解的知識。文獻(xiàn)信息服務(wù)的實踐表明,包括圖書館在內(nèi)的文獻(xiàn)信息服務(wù)機(jī)構(gòu),由于掌握著大量科研數(shù)據(jù),正是對科研數(shù)據(jù)實施動態(tài)管控的最佳信息組織。通過數(shù)據(jù)管控,可以為科研人員提供超越時空的圖書館泛化服務(wù),即移動性的數(shù)據(jù)、信息和知識獲取場所,零時差的獲取時間,多樣化的獲取工具。
在大數(shù)據(jù)時代,鑒于離散型的文獻(xiàn)和文獻(xiàn)檢索方法已無法滿足社會科學(xué)研究者對專題性、指向性強(qiáng)的學(xué)術(shù)文獻(xiàn)的需求,文獻(xiàn)信息服務(wù)機(jī)構(gòu)應(yīng)推進(jìn)集成式檢索,優(yōu)化數(shù)據(jù)挖掘技術(shù)、知識發(fā)現(xiàn)技術(shù),提供定制化、個性化、知識化服務(wù)。尤其是建立面向科技創(chuàng)新基地、科研院所、課題組乃至個人的學(xué)科化服務(wù)機(jī)制,進(jìn)一步拓寬文獻(xiàn)信息服務(wù)范圍,提升服務(wù)層次,加快學(xué)術(shù)交流和信息、知識的傳播速度,提高文獻(xiàn)信息資源的利用率和共享率,使文獻(xiàn)信息服務(wù)機(jī)構(gòu)的服務(wù)更直接、更有針對性,更好地服務(wù)于創(chuàng)新研究。
目前,我們對大數(shù)據(jù)的探索只是剛剛開始,科學(xué)認(rèn)識和把握大數(shù)據(jù)與經(jīng)濟(jì)社會發(fā)展的內(nèi)在關(guān)系、與信息和知識管理的內(nèi)在關(guān)系,可能是包括文獻(xiàn)信息工作者在內(nèi)的整個學(xué)術(shù)界在今后相當(dāng)長一段時間的重要課題。因此,文獻(xiàn)信息工作者不能停留在低層次、低水平重復(fù)的傳統(tǒng)內(nèi)容生產(chǎn)模式上,而應(yīng)適應(yīng)大數(shù)據(jù)時代的新形勢,推進(jìn)知識生產(chǎn)過程的有序化、結(jié)構(gòu)化。
人類正處在一個強(qiáng)調(diào)知識和信息的時代。培根曾提出“知識就是力量”,后來學(xué)術(shù)界又提出“信息就是力量”。現(xiàn)在,又有學(xué)者提出“共享知識就是力量”,強(qiáng)調(diào)把信息管理、信息共享提升到知識管理和知識共享的階段。利用互聯(lián)網(wǎng)來構(gòu)建知識社會,在網(wǎng)絡(luò)環(huán)境下實現(xiàn)知識交流與共享,這體現(xiàn)了時代的進(jìn)步,有著豐富的時代內(nèi)涵。在大數(shù)據(jù)時代,我們應(yīng)做好數(shù)據(jù)管控,把“共享知識就是力量”的理念貫徹到知識服務(wù)實踐中。