11月30日,由上海交通大學檔案館主辦、上海交通大學信息化推進辦公室協辦的《大數據環境下的高校檔案服務創新專題研討會》在上海交通大學錢學森圖書館舉行。
這是一次“跨界”的交流,大會邀請了上海市檔案局、上海市大數據中心、美國史密森學會、上海交通大學電子信息與電氣工程學院、上海圖書館以及清華大學檔案館、中山大學檔案館等單位的多位資深專家做專題報告,來自全國各地的50余位檔案領域的代表出席了會議,共同探討互聯網+和大數據背景下高校檔案服務工作新思路。
上海交通大學檔案館的館長張凱在致辭中表示,“高校檔案館必須主動迎接挑戰,深入思考大數據時代檔案工作,特別是深入了解電子政務,電子商務,以及大數據、云計算、人工智能等發展規劃。研究高校檔案工作如何在工作模式,基礎設施,法規政策,標準規范等方面與之對接,從而加快高校檔案工作轉型升級。”
高校檔案工作在全國檔案發展事業中是特殊一塊。中國高教學會高校檔案工作分會秘書長吳玫介紹,經過幾十年發展,高校檔案館在紙質文件環境下做了很多努力也積累了很多經驗,在當今大數據環境下,在互聯網+、信息化大背景下,如何做好高校檔案工作,充分發揮檔案價值作用,是所有高校檔案人面對的共同課題。
上午的第一個主旨報告由上海交通大學電子信息與電氣工程學院金耀輝教授帶來,題目為《大數據、人工智能引領新時代電子政務發展》,他以三個大數據與人工智能的落地案例分享,穿插技術講解,深入淺出的剖析了大數據技術在政府與企業工作中的實際應用。
金耀輝以上海自貿區的監管為例,介紹了大數據如何在企業監管中起到作用,通過數據自動識別,量化P2P風險,識別高風險企業。節省了金融管理、公安的大量人工。金耀輝認為,這是檔案數據通過大數據技術發揮的作用,而這個過程中的思路也可以延伸到高校檔案中來,檔案館保存了大量數據,要從數據走向服務,大數據在其他領域的應用案例值得參考。
美國史密森學會藏品系統和數字資產中心主任王敬獻教授以《大數據世界中的檔案數據》做了主旨報告。她以多年的經驗給大家分享了美國史密森學會是如何在檔案領域處理數據及運用大數據技術,為國內同仁今后的實施提供了寶貴的經驗。
王敬獻舉了大數據在醫療、超市、交通等方面的應用,借此,她認為,大數據很有潛力,但是數據本身毫無疑義,“我們必須通過統計分析和人工智能方法發覺豐富數據當中含義。當數據集變得如此之大的時候,云計算就給我們帶來援助。”
王敬獻介紹了美國史密森學會的數據整理經驗,1864年開始,史密森學會開始將紙卡轉為計算機卡,20世紀80年代開始第二代數據化之旅,把計算機穿孔卡轉為計算庫,1995年開始第三代數據化之旅。
“1980年到2007年之間,史密森學會各種各樣的數據庫都被開發,這些數據庫來自19個博物館,20個圖書館,14個檔案館,這些數據非常專業,有的是生物科學、航天航空科技、藝術美術設計、文化歷史藏品記錄。到2007年,史密森學會大概有100個左右獨立搜索網站。”龐大的數據庫對公眾產生很大困擾,王敬獻介紹,這時,史密森學會開始做數據匯總工作,從最初的整理到最后的綜合,建立了美國第一個一站式搜索系統,“現在,這個系統里面已經有1400萬條在線記錄。其中包括檔案記錄、信件、手稿、照片、口述實錄、藝術品、科技資料等等。”
下午的會議由上海市大數據中心數據資源部部長劉迎風、上海交通大學李政道圖書館館長李中清、上海圖書館副館長劉煒、清華大學檔案館研究館員薛四新、中山大學檔案館副館長劉一凡、上海市檔案局科技教育處主任科員王瑋這六位專家貢獻了精彩的報告,分別從不同的角度與領域和大家分享探討了大數據技術的應用、實踐與探索。