精品国产一级在线观看,国产成人综合久久精品亚洲,免费一级欧美大片在线观看

當前位置:安全行業動態 → 正文

國內外科研數據安全管理政策比較研究

責任編輯:editor006 作者:宋筱璇 王延飛 鐘燦濤 |來源:企業網D1Net  2017-07-12 16:36:15 本文摘自:《情報理論與實踐》

科研活動需要數據的支撐。研究過程中,為獲取數據往往需要消耗大量的人力、物力,同時也造成了數據的浪費。在這種情況下,科研數據的共享開始受到廣泛的關注。然而,在研究人員欣喜于科研數據共享的成果時,數據安全的問題日益暴露出來。隨著大數據的到來,數據安全的問題被愈加放大。如何既確保安全,又能高效地共享數據?對科研數據中的敏感信息如何進行處理?如何保護科研活動中的隱私?這些都是亟待被思考的問題。

1 相關研究

科研數據,也稱為科學數據,是科研活動中重要的產出之一[1]。在開放共享的大潮中,科研數據在科學合作、傳播和交流中具有重大戰略意義。科研數據安全既包括科研數據本身的安全,也包括數據相關利益主體的安全,特別是涉及主體隱私權的數據,在共享中受到更多的關注[2]。

利用CNKI和Web of Science文獻數據庫分別對國內外科研數據安全研究相關的文章進行檢索發現,盡管國內外都存在大量數據安全相關的研究,但國內對于直接研究科研數據安全的文獻還相對較少。在CNKI中以“科研數據安全”為檢索詞進行主題檢索,僅獲得4篇相關文獻,且主要研究數據平臺或系統的安全保障問題。而對于科研數據安全問題的探討往往嵌入在科研數據共享、開放獲取、數據管理等政策或技術研究中。

在科研數據管理或科研數據開放共享研究中,國內的相關研究基本處于介紹國外政策實例階段,科研數據安全問題只是作為其組成部分,通過經驗案例進行介紹,缺乏與我國本土實際情況的聯系。張瑤等[3]在調研與分析國外科研資助機構數據政策后發現,科研資助機構的數據政策中往往涉及數據的保密及安全規定。資助機構要求研究者遵循相關數據保護法規,特別要對機密和隱私數據設定數據共享限制,對人類受試者數據應采取匿名化、重新鑒定、隱藏標識符等方式處理。丁培[4]在對國外大學科研數據管理政策研究時發現,美國、英國以及澳大利亞的許多大學在數據管理政策中都涉及數據安全、隱私和保護的內容,具體包括:數據安全保護及保密的原則性說明;關于數據限制性訪問的說明;隱私以及保密協議的說明。張閃閃等[5]在對國外信息服務機構的數據管理政策進行調研時也發現,斯坦福大學圖書館在科研數據的處理上,注意隱私保護。當涉及人類受試者數據時,要接受監督并使用專門的數據搜集工具。

相較于國內,國外對于科研數據安全政策及技術的研究則更為全面,特別是在科研數據共享中涉及的隱私及敏感數據等問題受到廣泛關注。在政策上,美、英等國的科研資助機構(美國國家科學基金會(NSF),英國研究理事會(RCUK)等)和高校(哈佛大學、牛津大學等),紛紛制定了各自的科學數據開放政策指南或規定,其中包括數據的分類規則、數據共享的限制、數據處理等與科學數據安全相關的重要內容。在技術上,針對不同領域數據的特點,為數據存儲、訪問等過程的安全問題提供保障。Sydes等[6]基于臨床醫學試驗數據共享中的信息披露風險,開發了一套新的訪問控制的方法,從而保障數據共享中的安全。Dong等[7]對大數據共享平臺中涉及用戶個人信息的敏感數據,提出了新的基于異構密文轉換代理算法和基于虛擬機監視器的用戶進程保護方法,為安全共享這些敏感數據提供支持和保障。在涉及隱私及敏感數據的討論中,共享數據的識別或評價標準問題一直是相關學者關注的熱點之一,但始終沒有一套相對通用的評估方法。如Sariyar等[8]意識到幫助數據提供者來識別科學數據共享中可能存在的法律、倫理或社會敏感問題是一個經常被忽略但卻十分重要的環節。同時描述了一套復雜的監管環境,并提供相應的在線工具幫助數據供應商識別敏感數據及數據中涉及的法律倫理問題。Malin等[9]改進了安全港的HIPAA標準隱私規則和傳統的基于統計標準的隱私規則模型中的不足,提出了一個更直觀的De-identification方法對醫療研究中的病例數據進行評估,通過評估結果確認數據是否達到共享標準。

此外,隨著近年來科研數據共享中的數據安全問題受到越來越廣泛的重視,對于數據“邊開放邊保護”的呼聲越來越高,國外對于數據共享與數據安全之間關系的博弈也出現了新的現象。Dove[10]認為,對數據采用復雜的再編碼方式可能僅僅只是給機構審查委員會和研究倫理委員會創造的一種虛假的安全感,在一定程度上會阻礙科研數據的再研究和創造。Stoddart等[11]發現歐盟的數據保護是以特定地區法律或政策作為標準,對數據的透明度、質量、比例、安全、訪問和修編等限制方面進行評估。理論上,每個國家或地區的數據保護規定與歐盟的數據保護原則應該是一致或相似的。然而,近年來在數據保護決策方面的不一致愈發明顯,僅有5個國家或地區與歐盟相一致。這樣的不一致產生的直接負面作用就是阻礙了歐盟成員之間的數據共享。因此,在科研數據共享中,意識到數據安全問題,從政策和技術上為數據共享中的安全提供保障支持固然重要,但如何更好地實現“管為用,用中管”,在科研數據共享和安全中維持良好的平衡也是未來研究重要的方向。

近年來,我國各部委、省市及高校等科研單位紛紛建立起科學數據共享平臺。數據共享中的安全管理政策制定存在較大的優化空間。本文擬從科研數據共享與安全的基本原則、啟動時機、數據識別、評估監管和結果處理5個方面(如圖1所示),對比國內外各類科研機構或科研數據共享平臺的數據安全政策,并分析其中的共性與不足,以期為我國科研共享活動中的數據安全政策的規劃和建設提供相應的借鑒。

2 對國內外科研數據管理政策的解析

從國家基金組織、科研資助機構和高校等領域入手對國內外科研數據共享與安全的管理政策進行分析,可以發現國外呈現“鼓勵共享,安全協同”的狀態,國內則呈現“鼓勵共享,安全不足”的狀態。

2.1 “鼓勵共享,安全協同”的國外科研數據管理政策

1)國家基金組織、科研資助機構。根據DCC[12]網站上發布的英國研究資助者數據管理和共享計劃文件匯總,選取在數據管理和共享政策方面較為完善的6所科研資助機構,分別是:英國研究理事會(RCUK)[13]、英國癌癥研究中心(CRUK)[14]、英國生物技術與生物科學研究理事會(BBSRC)[15]、英國經濟和社會研究理事會(ESRC)[16]、英國醫學研究理事會(MRC)[17]、英國環境研究委員會(NERC)[18];同時納入美國國家科學基金委(NSF)[19]和美國國立衛生研究院(NIH)[20]共計8所科研資助機構作為分析對象。

英國癌癥研究中心(CRUK)[14]在其“數據共享和保護策略”中提出該條例不規定研究者應該何時以及如何保護和共享數據,而是使研究者在計劃和進行研究時明確應該注意的問題。調研中也發現,除了美國國立衛生研究院(NIH)[20]就人類受試者的隱私和數據保護問題進行了相對具體的規定,其余基金組織及科研資助機構主要著眼于從整體政策的角度探討科研數據共享與安全中可能存在的問題,而不涉及具體數據的識別、處理和監管細則。8所國外組織機構中涉及數據共享中數據安全問題的代表性文件及政策細則如表1所示。

從表1的結果可知,這些機構普遍具有與數據共享與安全相關的政策或規定,但是這些規定大都以“數據”作為其命名主要成分,沒有將“數據安全”問題作為獨立個體進行規范,數據安全問題僅僅是其政策規定的部分內容。

這些機構在數據共享與安全問題的基本原則上都鼓勵共享,如RCUK的“最大化共享”,CRUK的“及時、負責任的共享”,NIH的“廣泛、免費的共享”等,也都承認存在數據安全或數據隱私的問題,這些問題可能包括數據的機密性、敏感性,受試者的隱私等各類法律倫理限制,而當研究涉及人類時,數據的安全問題就顯得尤為重要。NIH[20]規定涉及人類受試者的數據應遵守HIPPA隱私規則,受機構審查委員會(IRB)的監管;同時規定在數據共享前,應進行數據匿名處理。具體表現為重新修訂所有標識符,以減少信息披露的風險。對于姓名、地址、電話號碼和社會安全號碼一類的直接標識符應直接刪除;對于間接標識符和其他信息應防止“演繹披露”的發生。(所謂“演繹披露”即通過一些變量的聯系推測出一些關鍵的變量特征。如將人口信息、地理信息和其他信息聯系起來可能反映出受試者的某些隱私信息。)在數據共享中可采用兩種方式來確保數據安全:僅保留數據的一部分內容;或是從統計學的角度對數據進行二次編碼。

在數據安全相關問題的關注時間上,RCUK、CRUK、NSF、NIH等科研機構都主張任何有關數據的問題都應該在研究開始前就先被考慮到。ESRC承認法律、倫理或商業約束會影響數據共享,提出這些限制應該被詳細考慮在研究開始之前,并貫穿研究數據的整個生命周期中。此外,調研發現8個科研資助機構都規定研究者在申請項目時應該同時提交一份類似于“數據管理和共享計劃”的文件。該文件作為申請的評估對象之一描述的是申請者對申請項目研究成果共享中應該遵守的政策規定。例如NSF[19]的數據管理和共享計劃要求包括以下5方面的內容:①研究中的數據、樣本、物理集合、軟件、課程材料和項目過程中產生的其他材料的類型;②數據的標準,元數據的格式和內容;③適當的隱私保護,數據機密性,安全性,知識產權或其他權利或要求;④對重用、再分配及項目衍生品生產的政策或規定;⑤對數據、樣本和其他研究產品的歸檔及訪問保護計劃。

從數據的識別和評估來看,尚未有政策直接對如何識別敏感數據進行規定。但ESRC依據其細節、敏感性和機密性水平對數據進行分類,在此分類基礎上進行數據處理和數據安全保障的控制,因而從實質說來,數據分類的過程就是數據識別或評估的過程。

2)高校。高校作為研究實體,在依據各科研資助機構政策規則的基礎上,對實際數據的識別和敏感數據的處理方面進行了更詳盡的規定,盡可能地將存在共享限制或潛在威脅的數據轉化為可以公開的數據,在更大程度和范圍上實現科研數據的共享。本文選取了哈佛大學[21]、麻省理工學院[22]、加州大學伯克利分校[23]、斯坦福大學[24]、牛津大學[25]5所國外優秀高校,考察其已有的科研數據共享與安全的管理政策,特別關注其中關于數據的識別、監管和處理細節,具體如表2所示。

從表2可以看出,在數據評估與識別上,部分高校對其科研數據類型進行了劃分。其中哈佛大學為解決各領域機密和敏感數據的保護問題,在其數據安全政策(HRDSP)[21]中,將不同領域的數據依據其安全控制需求的程度分為5個級別,分別是:(1)非機密研究信息;(2)應該設為機密的信息;(3)敏感或者機密的信息;(4)非常敏感的信息;⑤極度敏感的信息。絕大多數涉及人類受試者的敏感數據被劃分為第3級數據,與國家安全相關的數據通常屬于第4級數據。HRDSP還規定了每個級別數據的最低保護要求。研究人員在項目初始之時,首先需要為即將產生的數據確立一個安全級別,以確定研究中對產生數據的安全控制水平。研究者可自行確定研究數據1~3級安全級別,但若研究涉及4、5級數據,則需要提交哈佛大學信息技術委員會(HUIT)審批。加州大學伯克利分校[23]基于數據需要保護的水平,制定了一套數據分類標準,以此評估數據的敏感性,具體分為0~3共4個級別。0級:公開的信息,例如網頁、課程信息等;1級:在一定條件下可發布的信息,例如學生學號;2級:有一定保密要求的數據元素,例如社會保險號;3級:在多個敏感系統之間存在共享風險的數據,例如備份數據系統。此外,未對數據進行分類的高校,共享中被限制較多的數據主要集中在人類受試者數據、醫療健康數據、敏感數據和機密數據幾部分。

在數據監管責任者方面,國外的高校主要集中在對人類受試者數據和醫療健康數據設有相應的評估機構和評估規范來確定該數據是否滿足共享的標準或是否觸犯相應的限制。哈佛大學和斯坦福大學都設有機構審查委員會,麻省理工學院設有人類被試委員會,加州大學伯克利分校設有保護人類受試者委員會,牛津大學設有研究倫理委員會對人類受試者數據進行評估。哈佛大學、麻省理工學院和斯坦福大學等還規定人類受試者和醫療健康數據必須遵守HIPPA隱私規則。這些機構或規則都以保護科研活動中的人類受試者為主要目的。以哈佛大學的機構審查委員會為例,下設人類受試者使用委員會(CUHS)和人類研究管理辦公室(OHRA)分管不同的項目。當研究涉及與人相關的新藥物或療法的調查、觀察研究、人體組織研究或其他關于人類的數據研究時,都必須在項目開始之前向IRB的ESTR平臺提交申請,申請包括其項目的完成形式和示例文檔,由IRB對應辦公室人員進行4周左右的時間審核,返回審核結果之后才能啟動研究項目。有時,一個研究項目可能需要多個委員會共同審核及批準,例如當進行干細胞研究時,哈佛大學就規定需要經IRB和胚胎干細胞研究監察委員會的共同審核。除了對人類受試者和醫療健康數據進行監管外,對于其他領域的數據,各高校也設立了對應的責任機構,例如哈佛大學在處理生物數據安全的相關問題時,通過微生物安全委員會的監管來進行。

在數據處理方面,目前主要采用數據匿名或數據調整的方式對敏感數據進行處理。數據匿名和數據調整方法是對科研數據中與研究對象身份相關的直接標識符進行刪除處理,部分間接標識符進行重新編碼后有選擇地共享,但處理的力度可能依據數據分類的不同級別而有所不同。對于可將變量之間相互關聯,從而能透露身份信息的關系數據應受到特別的關注。但數據處理也不宜過度,牛津大學指出,應實現合理化水平的數據匿名,不可不切實際或過于嚴厲地處理數據,當研究數據是一些采訪轉錄時,粗暴地刪除或聚合標識符,將使數據扭曲無法使用,可使用替代或模糊描述的方式加以轉化。

3)期刊、數據庫。除了上述機構和高校外,還有一些與科學研究密切相關的機構組織也關注科研數據的共享與安全問題,期刊和數據庫就是其中的代表。

《自然》[26]提出對出版論文及其數據訪問中可能造成的社會影響所產生的擔憂,這其中包括倫理問題、生物安全問題等。特別指出由于生化武器威脅的存在,對于生物論文及其數據的潛在安全威脅應由專家學者進行風險評估,并應有一個合適的政策來處理此類問題。盡管如此,在遵循共享與安全問題處理的基本原則基礎上,編輯部仍是鼓勵共享的。2012年2月《自然》期刊編輯部提出“盡管尚存爭議,但發布敏感數據的好處遠大于不出版它們所面臨的風險”[27],因而決定將一篇流感的論文全部出版。雖然面臨其中流感病毒的數據可能被恐怖組織或是個人瘋狂行為濫用的風險,但是該數據的發布對流感病毒的監測和人體健康具有重大意義。

美國校際社會科學數據共享聯盟(Inter-university Consortium for Political and Social Research,ICPSR)[28]是現在世界上最大的社會科學數據中心,在收集社會科學數據的過程中,也特別關注對受試者身份的保護。ICPSR規定在數據共享之前應將信息重新編碼,包括將日期轉換為時間間隔,將出生日期轉換為年齡組,將詳細的地理信息轉換為更廣泛的地理位置,將收入轉換為收入類別等。將被試的標識分為直接標識符和間接標識符兩類,對于顯性地指向特定的個人或單位的直接標識符在數據共享前必須進行移除或掩蓋。

2.2 “鼓勵共享,安全不足”的國內科研數據管理政策

與國外在科研數據共享與安全問題上的“鼓勵共享,安全協同”管理政策有所不同,國內在科研數據的管理中整體上呈現“鼓勵共享,安全不足”的狀態。

我國近年來建立了多個與數據共享相關的平臺。從國家角度,為加強科技創新基礎能力建設,推動我國科技資源的整合共享與高效利用,按照《關于開展國家科技基礎條件平臺認定和績效考核工作的通知》(國科發計[2011]318號)要求,科技部與各大高校、研究機構合作,完成了首批23家國家科技基礎條件平臺認定評審工作,并于2011年11月9日向全社會公布。其中包括6個科學數據共享平臺,分別是:林業科學數據平臺[29]、地球系統科學數據共享平臺[30]、人口與健康科學數據共享平臺[31]、農業科學數據共享中心[32]、地震科學數據共享中心[33]、氣象科學數據共享中心[34]。各省市地方響應號召,建立起各自的科學數據共享平臺,目前已完成的包括陜西省科學數據共享平臺[35]、山西省科學數據共享平臺[36]。此外,各高校和科研院所也逐步建立起自己的科研數據共享平臺或中心,例如北京大學[37]設立的開放研究數據平臺,中國科學院的基礎科學數據共享網[38],等等。

本文選取科技部的建構較為完善的6個科學數據共享平臺,來了解國內科研數據共享與安全管理政策的大致發展情況,具體如表3所示。

從表3中可以看出,林業科學數據平臺、人口與健康科學數據共享平臺、農業科學數據共享中心和地震科學數據共享中心都已經意識到共享數據存在安全問題,特別是涉及國家安全的涉密數據的安全問題。除此之外,還有個人隱私等法律限制方面的問題,并將具體規定寫入各自的數據共享管理辦法或數據共享元數據標準中。

數據分類可以在一定程度上為共享數據的限制評估做準備。在數據分類上,地震科學數據共享中心根據地震科學數據發布和共享的范圍,將數據劃分為以下4級:1級數據,凡可向社會公眾公開發布的數據;2級數據,能夠向國內、國外用戶提供的數據;3級數據,可以向國內用戶提供的數據;4級數據,只允許向特定范圍的用戶提供的數據。并規定用戶使用1級數據,可以在地震科學數據共享服務機構的網站上瀏覽、查詢和下載;用戶使用2級和3級數據,應在地震科學數據共享服務機構的網站上完成相應的注冊程序后獲得,必要時也可通過簽訂合同的方式獲得;用戶使用4級數據,應向地震科學數據共享服務機構提出申請,并經審核后方可獲取所需數據。林業科學數據平臺和人口與健康科學數據共享平臺則根據《GB/T7156—1987文獻保密等級代碼》,將數據劃分為6個保密級別,分別為公開數據、國家內部數據、部門內部數據、秘密數據、機密數據、絕密數據。

總體看來,國內的部分數據共享平臺雖然能夠意識到數據安全問題的存在,也有一定的數據管理政策或規定,但其對于數據類型的劃分或者是限制共享數據的識別的規定還過于寬泛,缺乏評估或識別的標準,也缺乏在數據評估執行中的責任或監管機構。同時,對于存在共享限制但在一定條件下能夠共享的數據,目前也沒有一套公開的數據處理管理辦法。

3 總結和建議

通過對比國內外科研機構數據共享與安全管理的相關政策規定可以發現,目前,國外主要采用“鼓勵共享,安全協同”的科研數據管理政策,對科研數據共享中的數據安全意識較高,管理架構相對完善。國內也開始意識到數據安全相關的問題,但仍處于探索發展階段,呈現“鼓勵共享,安全不足”的狀態。基于我國共享中的數據安全管理政策存在的不足,本文提出以下幾點建議:

第一,建立一套相對完整的數據安全問題評估標準。雖然部分數據共享平臺嘗試進行數據分類,但此種分類主要圍繞數據的保密分級進行,與數據的隱私、健康信息識別、數據的安全敏感度或潛在威脅識別等要求尚有不小的距離。在評估規范中落實關注安全隱患、對潛在威脅進行評估,才有可能識別出共享交流中存在安全問題的數據。

第二,組建跨領域的數據共享監管責任團隊。目前,國內的數據共享平臺中,數據使用及共享管理僅對本平臺負責,缺乏跨域、跨平臺的安全評估或監管介入,留出對科研數據共享的監管漏洞。

第三,權衡處理好數據安全與共享的關系問題。數據調整和數據匿名的方式,我們可以借鑒,但應慎重把握數據共享和數據安全中的度。過度調整雖然在一定程度上保護了數據,但也在更大程度上阻礙了數據的共享。

參考文獻:

[1]姜鑫.科學數據開放政策研究現狀分析及未來研究動向評判[J].現代情報,2016,36(2):167-170.

[2]馬海群,蒲攀.國內外開放數據政策研究現狀分析及我國研究動向研判[J].中國圖書館學報,2015(5):76-86.

[3]張瑤,顧立平,楊云秀,等.國外科研資助機構數據政策的調研與分析——以英美研究理事會為例[J].圖書情報工作,2015,59(6):53-60.

[4]丁培.國外大學科研數據管理政策研究[J].圖書館論壇,2014(5):99-106.

[5]張閃閃,顧立平,蓋曉良.國外信息服務機構的數據管理政策調研與分析[J].圖書情報知識,2015,167(5):99-109.

關鍵字:數據數據劃分數據安全

本文摘自:《情報理論與實踐》

x 國內外科研數據安全管理政策比較研究 掃一掃
分享本文到朋友圈
當前位置:安全行業動態 → 正文

國內外科研數據安全管理政策比較研究

責任編輯:editor006 作者:宋筱璇 王延飛 鐘燦濤 |來源:企業網D1Net  2017-07-12 16:36:15 本文摘自:《情報理論與實踐》

科研活動需要數據的支撐。研究過程中,為獲取數據往往需要消耗大量的人力、物力,同時也造成了數據的浪費。在這種情況下,科研數據的共享開始受到廣泛的關注。然而,在研究人員欣喜于科研數據共享的成果時,數據安全的問題日益暴露出來。隨著大數據的到來,數據安全的問題被愈加放大。如何既確保安全,又能高效地共享數據?對科研數據中的敏感信息如何進行處理?如何保護科研活動中的隱私?這些都是亟待被思考的問題。

1 相關研究

科研數據,也稱為科學數據,是科研活動中重要的產出之一[1]。在開放共享的大潮中,科研數據在科學合作、傳播和交流中具有重大戰略意義。科研數據安全既包括科研數據本身的安全,也包括數據相關利益主體的安全,特別是涉及主體隱私權的數據,在共享中受到更多的關注[2]。

利用CNKI和Web of Science文獻數據庫分別對國內外科研數據安全研究相關的文章進行檢索發現,盡管國內外都存在大量數據安全相關的研究,但國內對于直接研究科研數據安全的文獻還相對較少。在CNKI中以“科研數據安全”為檢索詞進行主題檢索,僅獲得4篇相關文獻,且主要研究數據平臺或系統的安全保障問題。而對于科研數據安全問題的探討往往嵌入在科研數據共享、開放獲取、數據管理等政策或技術研究中。

在科研數據管理或科研數據開放共享研究中,國內的相關研究基本處于介紹國外政策實例階段,科研數據安全問題只是作為其組成部分,通過經驗案例進行介紹,缺乏與我國本土實際情況的聯系。張瑤等[3]在調研與分析國外科研資助機構數據政策后發現,科研資助機構的數據政策中往往涉及數據的保密及安全規定。資助機構要求研究者遵循相關數據保護法規,特別要對機密和隱私數據設定數據共享限制,對人類受試者數據應采取匿名化、重新鑒定、隱藏標識符等方式處理。丁培[4]在對國外大學科研數據管理政策研究時發現,美國、英國以及澳大利亞的許多大學在數據管理政策中都涉及數據安全、隱私和保護的內容,具體包括:數據安全保護及保密的原則性說明;關于數據限制性訪問的說明;隱私以及保密協議的說明。張閃閃等[5]在對國外信息服務機構的數據管理政策進行調研時也發現,斯坦福大學圖書館在科研數據的處理上,注意隱私保護。當涉及人類受試者數據時,要接受監督并使用專門的數據搜集工具。

相較于國內,國外對于科研數據安全政策及技術的研究則更為全面,特別是在科研數據共享中涉及的隱私及敏感數據等問題受到廣泛關注。在政策上,美、英等國的科研資助機構(美國國家科學基金會(NSF),英國研究理事會(RCUK)等)和高校(哈佛大學、牛津大學等),紛紛制定了各自的科學數據開放政策指南或規定,其中包括數據的分類規則、數據共享的限制、數據處理等與科學數據安全相關的重要內容。在技術上,針對不同領域數據的特點,為數據存儲、訪問等過程的安全問題提供保障。Sydes等[6]基于臨床醫學試驗數據共享中的信息披露風險,開發了一套新的訪問控制的方法,從而保障數據共享中的安全。Dong等[7]對大數據共享平臺中涉及用戶個人信息的敏感數據,提出了新的基于異構密文轉換代理算法和基于虛擬機監視器的用戶進程保護方法,為安全共享這些敏感數據提供支持和保障。在涉及隱私及敏感數據的討論中,共享數據的識別或評價標準問題一直是相關學者關注的熱點之一,但始終沒有一套相對通用的評估方法。如Sariyar等[8]意識到幫助數據提供者來識別科學數據共享中可能存在的法律、倫理或社會敏感問題是一個經常被忽略但卻十分重要的環節。同時描述了一套復雜的監管環境,并提供相應的在線工具幫助數據供應商識別敏感數據及數據中涉及的法律倫理問題。Malin等[9]改進了安全港的HIPAA標準隱私規則和傳統的基于統計標準的隱私規則模型中的不足,提出了一個更直觀的De-identification方法對醫療研究中的病例數據進行評估,通過評估結果確認數據是否達到共享標準。

此外,隨著近年來科研數據共享中的數據安全問題受到越來越廣泛的重視,對于數據“邊開放邊保護”的呼聲越來越高,國外對于數據共享與數據安全之間關系的博弈也出現了新的現象。Dove[10]認為,對數據采用復雜的再編碼方式可能僅僅只是給機構審查委員會和研究倫理委員會創造的一種虛假的安全感,在一定程度上會阻礙科研數據的再研究和創造。Stoddart等[11]發現歐盟的數據保護是以特定地區法律或政策作為標準,對數據的透明度、質量、比例、安全、訪問和修編等限制方面進行評估。理論上,每個國家或地區的數據保護規定與歐盟的數據保護原則應該是一致或相似的。然而,近年來在數據保護決策方面的不一致愈發明顯,僅有5個國家或地區與歐盟相一致。這樣的不一致產生的直接負面作用就是阻礙了歐盟成員之間的數據共享。因此,在科研數據共享中,意識到數據安全問題,從政策和技術上為數據共享中的安全提供保障支持固然重要,但如何更好地實現“管為用,用中管”,在科研數據共享和安全中維持良好的平衡也是未來研究重要的方向。

近年來,我國各部委、省市及高校等科研單位紛紛建立起科學數據共享平臺。數據共享中的安全管理政策制定存在較大的優化空間。本文擬從科研數據共享與安全的基本原則、啟動時機、數據識別、評估監管和結果處理5個方面(如圖1所示),對比國內外各類科研機構或科研數據共享平臺的數據安全政策,并分析其中的共性與不足,以期為我國科研共享活動中的數據安全政策的規劃和建設提供相應的借鑒。

2 對國內外科研數據管理政策的解析

從國家基金組織、科研資助機構和高校等領域入手對國內外科研數據共享與安全的管理政策進行分析,可以發現國外呈現“鼓勵共享,安全協同”的狀態,國內則呈現“鼓勵共享,安全不足”的狀態。

2.1 “鼓勵共享,安全協同”的國外科研數據管理政策

1)國家基金組織、科研資助機構。根據DCC[12]網站上發布的英國研究資助者數據管理和共享計劃文件匯總,選取在數據管理和共享政策方面較為完善的6所科研資助機構,分別是:英國研究理事會(RCUK)[13]、英國癌癥研究中心(CRUK)[14]、英國生物技術與生物科學研究理事會(BBSRC)[15]、英國經濟和社會研究理事會(ESRC)[16]、英國醫學研究理事會(MRC)[17]、英國環境研究委員會(NERC)[18];同時納入美國國家科學基金委(NSF)[19]和美國國立衛生研究院(NIH)[20]共計8所科研資助機構作為分析對象。

英國癌癥研究中心(CRUK)[14]在其“數據共享和保護策略”中提出該條例不規定研究者應該何時以及如何保護和共享數據,而是使研究者在計劃和進行研究時明確應該注意的問題。調研中也發現,除了美國國立衛生研究院(NIH)[20]就人類受試者的隱私和數據保護問題進行了相對具體的規定,其余基金組織及科研資助機構主要著眼于從整體政策的角度探討科研數據共享與安全中可能存在的問題,而不涉及具體數據的識別、處理和監管細則。8所國外組織機構中涉及數據共享中數據安全問題的代表性文件及政策細則如表1所示。

從表1的結果可知,這些機構普遍具有與數據共享與安全相關的政策或規定,但是這些規定大都以“數據”作為其命名主要成分,沒有將“數據安全”問題作為獨立個體進行規范,數據安全問題僅僅是其政策規定的部分內容。

這些機構在數據共享與安全問題的基本原則上都鼓勵共享,如RCUK的“最大化共享”,CRUK的“及時、負責任的共享”,NIH的“廣泛、免費的共享”等,也都承認存在數據安全或數據隱私的問題,這些問題可能包括數據的機密性、敏感性,受試者的隱私等各類法律倫理限制,而當研究涉及人類時,數據的安全問題就顯得尤為重要。NIH[20]規定涉及人類受試者的數據應遵守HIPPA隱私規則,受機構審查委員會(IRB)的監管;同時規定在數據共享前,應進行數據匿名處理。具體表現為重新修訂所有標識符,以減少信息披露的風險。對于姓名、地址、電話號碼和社會安全號碼一類的直接標識符應直接刪除;對于間接標識符和其他信息應防止“演繹披露”的發生。(所謂“演繹披露”即通過一些變量的聯系推測出一些關鍵的變量特征。如將人口信息、地理信息和其他信息聯系起來可能反映出受試者的某些隱私信息。)在數據共享中可采用兩種方式來確保數據安全:僅保留數據的一部分內容;或是從統計學的角度對數據進行二次編碼。

在數據安全相關問題的關注時間上,RCUK、CRUK、NSF、NIH等科研機構都主張任何有關數據的問題都應該在研究開始前就先被考慮到。ESRC承認法律、倫理或商業約束會影響數據共享,提出這些限制應該被詳細考慮在研究開始之前,并貫穿研究數據的整個生命周期中。此外,調研發現8個科研資助機構都規定研究者在申請項目時應該同時提交一份類似于“數據管理和共享計劃”的文件。該文件作為申請的評估對象之一描述的是申請者對申請項目研究成果共享中應該遵守的政策規定。例如NSF[19]的數據管理和共享計劃要求包括以下5方面的內容:①研究中的數據、樣本、物理集合、軟件、課程材料和項目過程中產生的其他材料的類型;②數據的標準,元數據的格式和內容;③適當的隱私保護,數據機密性,安全性,知識產權或其他權利或要求;④對重用、再分配及項目衍生品生產的政策或規定;⑤對數據、樣本和其他研究產品的歸檔及訪問保護計劃。

從數據的識別和評估來看,尚未有政策直接對如何識別敏感數據進行規定。但ESRC依據其細節、敏感性和機密性水平對數據進行分類,在此分類基礎上進行數據處理和數據安全保障的控制,因而從實質說來,數據分類的過程就是數據識別或評估的過程。

2)高校。高校作為研究實體,在依據各科研資助機構政策規則的基礎上,對實際數據的識別和敏感數據的處理方面進行了更詳盡的規定,盡可能地將存在共享限制或潛在威脅的數據轉化為可以公開的數據,在更大程度和范圍上實現科研數據的共享。本文選取了哈佛大學[21]、麻省理工學院[22]、加州大學伯克利分校[23]、斯坦福大學[24]、牛津大學[25]5所國外優秀高校,考察其已有的科研數據共享與安全的管理政策,特別關注其中關于數據的識別、監管和處理細節,具體如表2所示。

從表2可以看出,在數據評估與識別上,部分高校對其科研數據類型進行了劃分。其中哈佛大學為解決各領域機密和敏感數據的保護問題,在其數據安全政策(HRDSP)[21]中,將不同領域的數據依據其安全控制需求的程度分為5個級別,分別是:(1)非機密研究信息;(2)應該設為機密的信息;(3)敏感或者機密的信息;(4)非常敏感的信息;⑤極度敏感的信息。絕大多數涉及人類受試者的敏感數據被劃分為第3級數據,與國家安全相關的數據通常屬于第4級數據。HRDSP還規定了每個級別數據的最低保護要求。研究人員在項目初始之時,首先需要為即將產生的數據確立一個安全級別,以確定研究中對產生數據的安全控制水平。研究者可自行確定研究數據1~3級安全級別,但若研究涉及4、5級數據,則需要提交哈佛大學信息技術委員會(HUIT)審批。加州大學伯克利分校[23]基于數據需要保護的水平,制定了一套數據分類標準,以此評估數據的敏感性,具體分為0~3共4個級別。0級:公開的信息,例如網頁、課程信息等;1級:在一定條件下可發布的信息,例如學生學號;2級:有一定保密要求的數據元素,例如社會保險號;3級:在多個敏感系統之間存在共享風險的數據,例如備份數據系統。此外,未對數據進行分類的高校,共享中被限制較多的數據主要集中在人類受試者數據、醫療健康數據、敏感數據和機密數據幾部分。

在數據監管責任者方面,國外的高校主要集中在對人類受試者數據和醫療健康數據設有相應的評估機構和評估規范來確定該數據是否滿足共享的標準或是否觸犯相應的限制。哈佛大學和斯坦福大學都設有機構審查委員會,麻省理工學院設有人類被試委員會,加州大學伯克利分校設有保護人類受試者委員會,牛津大學設有研究倫理委員會對人類受試者數據進行評估。哈佛大學、麻省理工學院和斯坦福大學等還規定人類受試者和醫療健康數據必須遵守HIPPA隱私規則。這些機構或規則都以保護科研活動中的人類受試者為主要目的。以哈佛大學的機構審查委員會為例,下設人類受試者使用委員會(CUHS)和人類研究管理辦公室(OHRA)分管不同的項目。當研究涉及與人相關的新藥物或療法的調查、觀察研究、人體組織研究或其他關于人類的數據研究時,都必須在項目開始之前向IRB的ESTR平臺提交申請,申請包括其項目的完成形式和示例文檔,由IRB對應辦公室人員進行4周左右的時間審核,返回審核結果之后才能啟動研究項目。有時,一個研究項目可能需要多個委員會共同審核及批準,例如當進行干細胞研究時,哈佛大學就規定需要經IRB和胚胎干細胞研究監察委員會的共同審核。除了對人類受試者和醫療健康數據進行監管外,對于其他領域的數據,各高校也設立了對應的責任機構,例如哈佛大學在處理生物數據安全的相關問題時,通過微生物安全委員會的監管來進行。

在數據處理方面,目前主要采用數據匿名或數據調整的方式對敏感數據進行處理。數據匿名和數據調整方法是對科研數據中與研究對象身份相關的直接標識符進行刪除處理,部分間接標識符進行重新編碼后有選擇地共享,但處理的力度可能依據數據分類的不同級別而有所不同。對于可將變量之間相互關聯,從而能透露身份信息的關系數據應受到特別的關注。但數據處理也不宜過度,牛津大學指出,應實現合理化水平的數據匿名,不可不切實際或過于嚴厲地處理數據,當研究數據是一些采訪轉錄時,粗暴地刪除或聚合標識符,將使數據扭曲無法使用,可使用替代或模糊描述的方式加以轉化。

3)期刊、數據庫。除了上述機構和高校外,還有一些與科學研究密切相關的機構組織也關注科研數據的共享與安全問題,期刊和數據庫就是其中的代表。

《自然》[26]提出對出版論文及其數據訪問中可能造成的社會影響所產生的擔憂,這其中包括倫理問題、生物安全問題等。特別指出由于生化武器威脅的存在,對于生物論文及其數據的潛在安全威脅應由專家學者進行風險評估,并應有一個合適的政策來處理此類問題。盡管如此,在遵循共享與安全問題處理的基本原則基礎上,編輯部仍是鼓勵共享的。2012年2月《自然》期刊編輯部提出“盡管尚存爭議,但發布敏感數據的好處遠大于不出版它們所面臨的風險”[27],因而決定將一篇流感的論文全部出版。雖然面臨其中流感病毒的數據可能被恐怖組織或是個人瘋狂行為濫用的風險,但是該數據的發布對流感病毒的監測和人體健康具有重大意義。

美國校際社會科學數據共享聯盟(Inter-university Consortium for Political and Social Research,ICPSR)[28]是現在世界上最大的社會科學數據中心,在收集社會科學數據的過程中,也特別關注對受試者身份的保護。ICPSR規定在數據共享之前應將信息重新編碼,包括將日期轉換為時間間隔,將出生日期轉換為年齡組,將詳細的地理信息轉換為更廣泛的地理位置,將收入轉換為收入類別等。將被試的標識分為直接標識符和間接標識符兩類,對于顯性地指向特定的個人或單位的直接標識符在數據共享前必須進行移除或掩蓋。

2.2 “鼓勵共享,安全不足”的國內科研數據管理政策

與國外在科研數據共享與安全問題上的“鼓勵共享,安全協同”管理政策有所不同,國內在科研數據的管理中整體上呈現“鼓勵共享,安全不足”的狀態。

我國近年來建立了多個與數據共享相關的平臺。從國家角度,為加強科技創新基礎能力建設,推動我國科技資源的整合共享與高效利用,按照《關于開展國家科技基礎條件平臺認定和績效考核工作的通知》(國科發計[2011]318號)要求,科技部與各大高校、研究機構合作,完成了首批23家國家科技基礎條件平臺認定評審工作,并于2011年11月9日向全社會公布。其中包括6個科學數據共享平臺,分別是:林業科學數據平臺[29]、地球系統科學數據共享平臺[30]、人口與健康科學數據共享平臺[31]、農業科學數據共享中心[32]、地震科學數據共享中心[33]、氣象科學數據共享中心[34]。各省市地方響應號召,建立起各自的科學數據共享平臺,目前已完成的包括陜西省科學數據共享平臺[35]、山西省科學數據共享平臺[36]。此外,各高校和科研院所也逐步建立起自己的科研數據共享平臺或中心,例如北京大學[37]設立的開放研究數據平臺,中國科學院的基礎科學數據共享網[38],等等。

本文選取科技部的建構較為完善的6個科學數據共享平臺,來了解國內科研數據共享與安全管理政策的大致發展情況,具體如表3所示。

從表3中可以看出,林業科學數據平臺、人口與健康科學數據共享平臺、農業科學數據共享中心和地震科學數據共享中心都已經意識到共享數據存在安全問題,特別是涉及國家安全的涉密數據的安全問題。除此之外,還有個人隱私等法律限制方面的問題,并將具體規定寫入各自的數據共享管理辦法或數據共享元數據標準中。

數據分類可以在一定程度上為共享數據的限制評估做準備。在數據分類上,地震科學數據共享中心根據地震科學數據發布和共享的范圍,將數據劃分為以下4級:1級數據,凡可向社會公眾公開發布的數據;2級數據,能夠向國內、國外用戶提供的數據;3級數據,可以向國內用戶提供的數據;4級數據,只允許向特定范圍的用戶提供的數據。并規定用戶使用1級數據,可以在地震科學數據共享服務機構的網站上瀏覽、查詢和下載;用戶使用2級和3級數據,應在地震科學數據共享服務機構的網站上完成相應的注冊程序后獲得,必要時也可通過簽訂合同的方式獲得;用戶使用4級數據,應向地震科學數據共享服務機構提出申請,并經審核后方可獲取所需數據。林業科學數據平臺和人口與健康科學數據共享平臺則根據《GB/T7156—1987文獻保密等級代碼》,將數據劃分為6個保密級別,分別為公開數據、國家內部數據、部門內部數據、秘密數據、機密數據、絕密數據。

總體看來,國內的部分數據共享平臺雖然能夠意識到數據安全問題的存在,也有一定的數據管理政策或規定,但其對于數據類型的劃分或者是限制共享數據的識別的規定還過于寬泛,缺乏評估或識別的標準,也缺乏在數據評估執行中的責任或監管機構。同時,對于存在共享限制但在一定條件下能夠共享的數據,目前也沒有一套公開的數據處理管理辦法。

3 總結和建議

通過對比國內外科研機構數據共享與安全管理的相關政策規定可以發現,目前,國外主要采用“鼓勵共享,安全協同”的科研數據管理政策,對科研數據共享中的數據安全意識較高,管理架構相對完善。國內也開始意識到數據安全相關的問題,但仍處于探索發展階段,呈現“鼓勵共享,安全不足”的狀態。基于我國共享中的數據安全管理政策存在的不足,本文提出以下幾點建議:

第一,建立一套相對完整的數據安全問題評估標準。雖然部分數據共享平臺嘗試進行數據分類,但此種分類主要圍繞數據的保密分級進行,與數據的隱私、健康信息識別、數據的安全敏感度或潛在威脅識別等要求尚有不小的距離。在評估規范中落實關注安全隱患、對潛在威脅進行評估,才有可能識別出共享交流中存在安全問題的數據。

第二,組建跨領域的數據共享監管責任團隊。目前,國內的數據共享平臺中,數據使用及共享管理僅對本平臺負責,缺乏跨域、跨平臺的安全評估或監管介入,留出對科研數據共享的監管漏洞。

第三,權衡處理好數據安全與共享的關系問題。數據調整和數據匿名的方式,我們可以借鑒,但應慎重把握數據共享和數據安全中的度。過度調整雖然在一定程度上保護了數據,但也在更大程度上阻礙了數據的共享。

參考文獻:

[1]姜鑫.科學數據開放政策研究現狀分析及未來研究動向評判[J].現代情報,2016,36(2):167-170.

[2]馬海群,蒲攀.國內外開放數據政策研究現狀分析及我國研究動向研判[J].中國圖書館學報,2015(5):76-86.

[3]張瑤,顧立平,楊云秀,等.國外科研資助機構數據政策的調研與分析——以英美研究理事會為例[J].圖書情報工作,2015,59(6):53-60.

[4]丁培.國外大學科研數據管理政策研究[J].圖書館論壇,2014(5):99-106.

[5]張閃閃,顧立平,蓋曉良.國外信息服務機構的數據管理政策調研與分析[J].圖書情報知識,2015,167(5):99-109.

關鍵字:數據數據劃分數據安全

本文摘自:《情報理論與實踐》

電子周刊
回到頂部

關于我們聯系我們版權聲明隱私條款廣告服務友情鏈接投稿中心招賢納士

企業網版權所有 ©2010-2024 京ICP備09108050號-6 京公網安備 11010502049343號

^
  • <menuitem id="jw4sk"></menuitem>

    1. <form id="jw4sk"><tbody id="jw4sk"><dfn id="jw4sk"></dfn></tbody></form>
      主站蜘蛛池模板: 伊宁市| 宜城市| 大厂| 万源市| 阿鲁科尔沁旗| 腾冲县| 新沂市| 年辖:市辖区| 奉节县| 三都| 庆阳市| 积石山| 唐海县| 昌图县| 台南县| 定西市| 临夏市| 罗甸县| 长宁县| 建始县| 常山县| 凤山市| 远安县| 隆化县| 阳春市| 隆林| 青海省| 南投市| 松溪县| 卫辉市| 阆中市| 璧山县| 墨脱县| 绿春县| 铜川市| 全州县| 南靖县| 天气| 册亨县| 四平市| 册亨县|