“我們的最終目標是建立中國文化大數據共享機制,以促進文化大數據的快速流通,加快我國文化產業的快速發展,實現‘大文化’監管技術標準和平臺的建立。”日前,國家社科基金藝術學重大項目“文化大數據的共享機制研究”在上海交通大學徐匯校區開題。
文化大數據共享面臨諸多挑戰
“文化大數據的共享機制研究”是2017年度國家社科基金藝術學重大招標項目。上海交通大學人文藝術研究院副院長、教授徐劍率領團隊中標該項目。在開題報告會上,徐劍就課題前期取得的階段性進展進行了匯報,并重點對該課題的總體框架、研究內容、研究方法、研究思路和預期目標進行了扼要介紹。專家評審組對課題進行了評審。
徐劍表示,文化大數據還是一個全新的領域,目前討論較多的還是比較寬泛的概念,并未形成比較統一的定義。文化大數據的格式包括全文、空間、靜態圖像、靜態圖形、動畫、視頻、音頻、音樂等,它們大多是半結構化或非結構化的數據。行業的實踐多集中在某一文化領域或某一媒體類型,跨行業、跨媒體的文化大數據發展模式基本空白。在談到文化大數據的代表性成果時,徐劍表示,相關研究很多,但尚未針對文化大數據開展系統研究。現有的理論探討也缺乏完整的分析框架。此外,單形態的文化數據研究較多,多形態文化數據的跨學科研究缺乏。“目前有關大數據技術相關標準的研制還處于起步,對文化大數據標準化的研究尚處于空白,因而文化大數據的標準化工作極具挑戰。”徐劍教授說。
目前,在我國進行文化大數據研究面臨的挑戰主要有兩點。一是,由于我國政府部門信息共享基礎設施及技術相對滯后,政府部門之間缺少統一的建設標準,缺乏數據共享交換意識,缺乏必要的法律規范體系保障數據共享交換的安全,缺乏統一數據的共享交換平臺,制約了大數據的流通和相應產業的發展;二是,版權是文化大數據的產權基礎,在網絡時代,一方面,面臨著版權侵害的挑戰,另一方面,又要在開放共享平臺上協調好各方權利人的利益。在這種政策環境和研究現狀下提出并研究文化大數據的共享機制具有十分重要的學術價值和現實意義。
實現跨部門跨行業共享連接
徐劍表示,“文化大數據的共享機制研究”旨在從理論上將知識管理、知識創新和知識產權利益平衡理論相結合,構建起基于知識創新的文化大數據共享理論模型。實現不同數據形式(文字、圖片、音頻和視頻等)之間的內容識別、匹配和連接;實現文化大數據跨部門、跨行業的共享連接;建立起“大文化”監管的技術平臺并制定完善的政策措施和建議。“從創新性看,該課題有3個創新點。首先是理論創新,提出了基于知識創新的文化大數據共享理論模型。其次是標準創新,將文化大數據標準化,為快速標注、關聯、匹配文化大數據提供了技術規范和準則。最后是技術創新,通過數據挖掘、神經網絡和云計算等技術手段,建立起文化大數據的連接網絡。”他說。
該課題預期目標有3個層面。從理論層面上,結合知識管理、知識創新和知識產權利益平衡理論,構建起文化大數據共享理論模型;從應用層面上,實現文化大數據的全媒體、跨部門、跨行業的“大文化”實時監管;最后,由理論層面和應用層面上升為政府服務層面,以期提升我國文化大數據的共享管理水平。“實現這3個層面目標的重點在于構建基于知識創新的文化大數據共享理論,構建文化大數據的標準化標簽語義庫,以及形成文化大數據的跨部門整合機制。”徐劍表示。
在總體思路的基礎上,徐劍詳細介紹了擬采用的研究路徑和研究方法。“研究團隊擬采用內容分析法和數量研究法等研究方法,從理論支持入手,建立知識創新的文化大數據理論,在此基礎上,構建文化大數據標簽庫。通過對文化大數據的連接,建立文化大數據的共享機制。”他說,在上述研究思路、研究路徑和研究方法的基礎上,將“文化大數據的共享機制研究”分為5個子課題,子課題之間彼此關聯,層次分明地構成了文化大數據研究的整體框架。
子課題一“文化大數據的基礎理論研究”主要研究內容包括3個方面,一是文化大數據的定義及內涵,二是基于知識創新的知識產權制度變革,三是中國文化大數據的開放共享模型C-DOS。
子課題二“文化大數據的標準化標簽語義庫研究”主要研究內容包括建立文化大數據編碼指標體系庫,構建多形態文化數據標簽標準化體系。
子課題三“文化大數據的跨部門、跨行業的共享機制研究”主要研究內容包括3個層面,一是通過技術手段來實現跨部門、跨行業網站和數據庫的互聯互通。二是從政策和法律層面構建文化大數據共享機制的保障體系。三是從操作化層面構建基于文化領域本體的內容標注體系。
子課題四“文化大數據的版權溯源機制研究”主要研究思路是通過對文化數據來源和文化數據格式的規范以及對文化數據的抽取和存儲,構建文化大數據的版權溯源機制。
子課題五“文化大數據可視化和共享平臺建設研究”主要是建設“文化大數據在線共享平臺”。
“基于上述5個維度和視角,對我國文化大數據的現狀進行分析和總結,構建學術理論。同時,將文化大數據標準化,提供快速標注、關聯、匹配文化大數據技術規范和準則,建立文化大數據的信息共享平臺,最終實現文化大數據的全媒體、跨部門、跨行業的大文化實時監管。”徐劍表示。
提升我國文化大數據共享管理水平
評審組專家在聽取課題設計匯報后,充分肯定了這項重大項目重要的學術研究價值和現實意義,認為課題立意新穎,切入點精準,研究目標明確,研究內容合理,研究重點突出,研究思路清晰,研究方法合理可行,該課題是一項深入的跨學科研究課題。該項目創造性地結合現有理論構建起文化大數據的共享理論模型,將有助于提升我國文化大數據的共享管理水平,促進我國文化事業和產業的迅速發展。
與會專家們針對課題研究思路和各子課題的匯報內容,提出了富有建設性的意見與具體的建議。上海交通大學媒體與設計學院黨委書記、特聘教授單世聯指出,文化大數據是一個較大的范疇,該項課題首先要解決的問題是文化大數據的界定,在此基礎上才能確定研究的范圍。復旦大學新聞學院常務副院長、教授黃瑚建議將“文化”定義為狹義的文化,在此基礎上對“文化大數據”的內涵、外延進行定義。他同時指出,大數據是當今的世界性議題,梳理世界文化強國的文化大數據體系及其發展路徑,從中發現國內外文化大數據發展模式和支持體系的差異,吸取和借鑒海外的模式和經驗,對課題的深入研究有重要的意義。總的來說,此課題具有較高的現實意義和科研價值。
上海交通大學媒體與設計學院教授張國良指出,要區分出文化大數據與政治、經濟大數據的區別,首先是定義何種作品或產品屬于文化范疇,只有在準確定義的基礎上,才能產生具有科學性的研究成果。上海交通大學人文藝術研究院教授葛巖指出,要確定何為共享機制,并對共享機制數據庫的數據應用和內容選擇提出探討。
北京師范大學藝術與傳媒學院院長、長江學者特聘教授胡智鋒認為,該課題提出在學術層面上進行理論構建,可對文化大數據的概念進行嚴謹的論證,并實現跨學科的學術孵化。上海交通大學文科建設處處長、教授吳建南指出,課題應在大數據的共享機制研究框架下聚焦文化內容,既要不離大數據共享機制研究的普遍性,又要有文化內容的特殊性。
華東師范大學傳播學院教授嚴三九認為,做好一個課題有3個要點,首先,立意要高,此課題要以為國家文化戰略服務為目標;其次,成果要實,即提出一套可行性的方案;最后,要找到解決問題的辦法。上海交通大學社會認知與行為科學研究院教授蔣宏認為,要找到課題的價值取向,發展出一套研究文化數據的方法。評審專家組成員同時對文化數據庫建設的目的、如何平衡數據安全與數據共享之間的關系、在安全的前提下進行共享、如何利用現有的工具處理文化大數據等問題進行了深入的探討。
專家組期望項目組成員進一步細化研究工作,盡快開展研究工作,爭取早日取得研究成果。