知識因發現而更加美麗,圖書館因發現系統而更加絢麗自 20世紀90年代中期美國開始實施信息高速公路計劃以來,數字圖書館就已經成為席卷全球的圖書館發展大勢。中國數字圖書館建設與發展的里程碑與劃時代標志是1998年國家正式批準實施的中國高等教育文獻保障系統(China Academic Library & Information System,簡稱CALIS)。1999年CALIS項目開始全面啟動,迄今已是16年。在這短暫的16年中,引領中國圖書館發展方向的高校圖書館已經實現了華麗轉身,完成了質的飛躍。
圖書館不再是紙本的世界,目前,“985”高校圖書館擁有的外文數字資源更是已經可以與國際一流大學圖書館的數字資源媲美,各高校圖書館的中文數字資源數量早已遠遠超越其紙質資源。
隨著數字資源的迅速增長,面對紛繁復雜的海量信息,科研用戶的需求已不僅僅是獲取大量間接信息資源,更重要的是直接獲取能夠解決問題的精準知識。為了向高校師生、學科建設與發展提供一流的服務,作為各種資源和信息匯集中心的高校數字圖書館,必須改變傳統只能提供文獻資源的信息服務模式,轉入到能夠提供問題解決方案的知識服務模式。
知識發現服務的理念在圖書館界的應用可謂是源遠流長。著名的圖書館學家阮岡納贊在對圖書館五定律的闡述中早已明確了圖書館資源發現服務的實質,是圖書館界最早、最真實的發現服務。如今,網絡和現代技術多維度地深入到了圖書館的各項服務工作中,信息、情報以及智能轉換發現貫穿于現代圖書館服務的整個過程。資源發現、情報發現、用戶發現的壓力使圖書館發現服務被賦予更深更廣的內涵,知識發現服務越來越多地被圖書館高度重視。
知識發現服務是數字圖書館信息服務的高級階段,是信息服務發展的必然趨勢。在面向高校學科用戶知識需求解決過程中,針對高校用戶在知識獲取、知識選擇、知識吸收、知識利用、知識創新過程中的需求實施深層次服務。對相關學科專業知識進行搜尋、組織、分析、重組,為學科用戶提供所需專業知識的服務。
基于對知識發現服務的重視,高校圖書館通過建立期刊導航和數據庫導航、提供SFX鏈接服務、建設集成檢索系統、包括引入眾多國內外的知識發現系統。知識發現系統平臺的確很好的實現了知識發現的深層次服務,一定程度地提高圖書館數字資源的使用率。
可以看到,近幾年,各高校圖書館紛紛引入Summon、Primo、Encore、超星等統一資源發現系統,為讀者用戶提供集成資源檢索與發現服務。主要解決圖書館只能對其本館資源揭示數據庫名稱或期刊刊名,但無法揭示更細粒度的論文。其原理是:系統提供商通過與出版社等內容提供商的合作,對海量的元數據進行預加工與存儲;另一方面,系統提供商獲取到高校圖書館所購買的數據庫信息和自建數據庫的元數據。將兩者對接起來,實現高校圖書館購買資源或本地資源的統一檢索。
所以,統一資源發現系統有以下幾個優勢:
統一的檢索入口,用戶不必在各個數據庫之間切換跳轉;
元數據集成存儲,檢索速度較快,并且檢索結果呈現相對規范;
針對各圖書館資源進行索引,原文鏈接與獲取的服務可以得到更好的保障;
各圖書館可以針對性地提出一些個性化功能和服務,以更好地滿足讀者需求。
但在實踐中,同圖書館的各類軟件相比,用戶更加習慣使用百度學術、 谷歌學術等互聯網產品進行資料查詢,鎖定所需材料,進而再到圖書館獲得全文資源。更為甚者,很多學生都不知道他所獲得的全文服務是由圖書館提供的!這是什么原因?
目前的知識發現系統對數據資源的整合遠遠不夠,統一資源發現系統主要進行了元數據題錄層面的揭示,但沒有做引文層面的揭示,而用戶在檢索時往往會通過引文信息來判斷文獻的質量。另外,檢索的召回準確效果一般。對于一個搜索引擎來說,檢索相關性做到及格分很容易,但如果想做到優秀還是非常難的,想達到滿分那是幾乎不可能。平臺的響應速度和穩定性。相比用戶青睞的互聯網產品,統一資源發現系統響應仍舊過慢,而且服務不夠穩定。
圖書館在被動提供知識的空間向主動推送精準服務轉型的過程中,需要充分利用先進的搜索引擎技術才能在知識服務方面充分發揮知識服務優勢。
去年,百度學術悄然上線,向各高校鋪開免費的統一資源發現服務,圖書館與互聯網的緊密結合,是不是能夠更好的連接與用戶的服務?這是值得嘗試和推敲的。
在對海量資源的高度集成及深度加工、大數據計算能力、穩定的檢索服務及優質的檢索效果保障都是作為互聯網產品的佼佼者,是有較為明顯的優勢的。其成熟的統計平臺及用戶行為分析技術還能更好幫助圖書館分析用戶行為,優化用戶體驗。
優勢一:對海量資源的高度集成及深度加工
百度學術的元數據獲取方式主要有三種:
①與世界知名內容提供商進行一對一合作,授權獲取到最為全面、穩定、優質的題錄數據;
②對于部分開放資源,采用如OAI-PMH協議等的元數據收割技術進行數據收集;
③對于長尾站點,充分發揮搜索引擎的技術優勢,利用爬蟲進行數據的收錄、解析、加工處理?;谝陨戏绞綐嫿ǔ鲎顬槿娴脑獢祿臁?/p>
優勢二:大數據計算能力
百度學術充分發揮大數據計算優勢,對億級別的海量資源進行實時計算和更新,并深度加工形成高質量的學者庫、期刊庫、會議庫、機構庫等知識庫,以期為用戶提供更為優質的信息揭示服務。
優勢三:穩定的檢索服務及優質的檢索效果保障
百度學術基于百度的檢索技術,可保證每天上億次檢索請求,并將響應時間控制在亞秒級別。此外,百度學術除了引入相關性計算外,還會綜合考慮文獻被他人引用情況、文獻的作者影響力、文獻的出版來源影響因子、時間等等因素綜合給出優質的排序效果。
優勢四:成熟的統計平臺及用戶行為分析技術
百度擁有較為成熟的統計平臺,可以對用戶使用行為日志進行實時存儲、統計、可視化。幫助站長分析用戶行為,優化用戶體驗;同時也可以幫助站長更好地監控到系統問題,保障用戶的穩定使用。