2013年初,在care.data
項目計劃發布后,就有一些隱私保護組織發起了“醫療數據保密倡議”,呼吁關注醫療數據使用過程中面臨的安全威脅。但NHS并沒有表達其與公眾進行溝通和咨詢的意圖,還強調從2013年9月份開始,將正式對集中后的醫療數據進行分析挖掘。
Care.data在實際運作過程中存在三方面的主要問題:首先是管理和溝通方面;其次是過于依賴技術手段;再次是規則方面的準備不足。
今年5月25日,李克強總理在出席貴陽“大數據產業峰會”時,將大數據比作“21世紀的鉆石礦、智慧樹”。之后不到一個月,國務院就于6月21日對外發布《關于促進和規范健康醫療大數據應用發展的指導意見》,提出“健康醫療大數據是國家重要的基礎性戰略資源”;發展健康醫療大數據應用,“將帶來健康醫療模式的深刻變化,有利于提高健康醫療服務效率和質量,增加有效供給、滿足群眾需求,促進培育新業態、形成新的經濟增長點”。這份《指導意見》被普遍認為吹響了我國發展健康醫療大數據應用的號角。
確實,將大數據技術應用于健康醫療領域,能帶來無限的想象空間。例如在美國,IBM人工智能引擎Watson已經學習了超過60萬份醫學證據報告、150萬份病歷和臨床試驗、200萬頁醫學期刊研究成果。目前,享譽世界的紀念斯隆—凱特琳癌癥中心(Memorial Sloan-Kettering Cancer Center)的腫瘤醫生正借助Watson,根據每位病人的癥狀、基因、病史等量身定制治療方案。
在英國,今年7月,打敗圍棋高手李世石的谷歌人工智能引擎DeepMind宣布與英國Moorfields眼科醫院合作,將對超過100萬份的眼部掃描文件進行數據分析和挖掘,創造出能更快、更早地探測出眼部病變的計算機算法。據英國國家醫療服務體系(National Health Service, NHS)統計,98%以上的糖尿病視網膜病變所引起的視力受損,能夠通過早期的檢測和治療而避免。
有IBM和谷歌等公司強大的技術實力,再加上豐富的醫療健康大數據作為支撐,不難想象在未來人工智能和大數據技術能做出的巨大貢獻。《指導意見》將發展健康醫療大數據應用作為“努力建設人民滿意的醫療衛生事業”的關鍵之一,無疑是找對了抓手,切中了要害。
命途多舛的care.data
讓我們將目光轉向英國。在2012年倫敦奧運會開幕式上,英國人將女作家J·K·羅琳與她的哈利·波特,以及提供全民免費醫療的NHS,作為英國最引以為傲的兩項代表。顯然,英國人不會錯過利用大數據技術改善NHS的機會。
早在2011年,時任英國首相卡梅倫就提出,要將NHS累積的醫療健康大數據運用于研究,不僅病患能更快地享受到更有效的治療,還能進一步鞏固英國醫療行業在全世界的領先地位。卡梅倫期待,通過與產業、研究機構共享NHS的醫療健康大數據,NHS能夠成為“引領全球醫療創新的典范”。
2013年,英國啟動了醫療健康大數據旗艦平臺care.data。care.data集中了最詳盡的數據,包括全英國的家庭醫生(General Practitioner, GP)和醫院記錄的病歷,以及社會服務信息;數據將用于除“直接醫療”(direct care)之外的目的。NHS期待通過數據資源的統一歸口、共享、分析,能夠更好地認識病患,研發藥物和治療方式;認識公共衛生和疾病的發展趨勢,保障每個人享有高質量的服務;在有限預算中更好地分配醫療資源;監控藥物和治療的安全狀況;比較全國各區域的醫療質量。care.data從誕生之日起就被寄予厚望。
然而就在2016年7月6日,英國NHS卻決定從即日起停止care.data計劃。如果說將大數據技術運用于醫療健康這個大方向沒變的話,那到底NHS在運營care.data的過程中遇到了什么問題?中國在發展醫療健康大數據時,又能從中借鑒什么經驗教訓?在討論這些問題前,有必要先回顧下從2013年到現在的這三年間,圍繞care.data發生的那些事兒。
雖然NHS在2012年提出care.data計劃,但其基本邏輯可以追溯到一個世紀前。1911年,家庭醫生的病人醫療記錄就被英國政府用于集中統計分析,從紙質記錄時代到數字化時代,英國一直致力于對醫療數據的集中化和醫療數據分析挖掘,以改善整體醫療水平。2000年,NHS提出了IT計劃,擬建設全國集中的醫療保健數據資源庫,并允許其數據可被用于科學研究。然而,多年以來,一系列的醫療數據集中化應用的計劃并沒有取得理想效果,反而引來了眾多批評的聲音。
2012年英國通過的“醫療和社會保健法案”(Health and Social Care Act)規定,由醫療和社會保健信息中心(Health and Social Care Information Centre, HSCIC)代替之前的NHS信息中心,具體負責所有醫療數據的收集、傳輸、分析和分享。
2013年,英格蘭NHS委員會正式公開了care.data項目的具體實施計劃:由英格蘭NHS指導HSCIC從公立醫療機構和GP收集醫療數據,并保存在一個國家級數據庫。同時,允許NHS和符合條件的私營公司對數據進行研究,并聲明研究目的為評估NHS所屬醫院的安全狀況、監控疾病的發展趨勢及策劃新的醫療服務。
2013年初,在care.data項目計劃發布后,就有一些隱私保護組織發起了“醫療數據保密倡議”(medConfidential),呼吁關注醫療數據使用過程中面臨的安全威脅。但NHS并沒有表達其與公眾進行溝通和咨詢的意圖,還強調從2013年9月份開始,將正式對集中后的醫療數據進行分析挖掘。
2013年8月,家庭醫生收到了NHS的通知,要求其在8周內通知他們的病人care.data項目需要收集、分析其數據。該舉動立即引起了家庭醫生的集體反對。原因是按英國1998年頒布的“數據保護法案”(Data Protection Act)的規定,家庭醫生是病人隱私數據的控制者。如果在將其控制的病人數據用于“直接醫療”之外的目的時,必須及時通知到病人并征求同意,否則可能會承擔法律責任。
NHS提出的要求讓家庭醫生感到非常為難。有媒體在對400位家庭醫生調查后發現,41%的病人選擇退出care.data項目,16%的病人還未做出決定,而且在沒有充分時間和資金的情況下,家庭醫生很難通知到數量眾多的病人。2013年10月,在家庭醫生強烈抗議下,NHS表示將投入200萬英鎊向公眾宣傳care.data項目內容。
2014年,care.data依舊麻煩不斷。首先,NHS的宣傳活動僅是在官網發布視頻和向公眾派發傳單。雖然制作、分發傳單的花銷高達100萬英鎊,但后續抽樣調查中卻發現只有不到三分之一的人表示收到過傳單,公開宣傳的效果大打折扣。
其次,HSCIC承認其向保險公司出售過病人的數據,面臨嚴厲的數據保護審查。HSCIC的數據披露審計報告顯示,醫療數據已經被披露給160個組織,其中包括56家私人企業,雖然HSCIC聲明數據已經被匿名化處理,但隱私專家強烈質疑其處理過程的有效性,其披露的數據完全可能被保險公司等組織重新識別為個人數據。
2014年2月,NHS表示,家庭醫生可延緩6個月上傳病人數據,并首次承認care.data項目面臨嚴重的信任危機。隨后,NHS宣布于2014年秋天選取4個地區開展新的試點,收集265名家庭醫生掌握的200萬病人的數據,事實上,直至2015年6月,第一個試點才進行開展。
盡管英國政府推出care.data項目的初衷很好,但其實施過程可謂一波三折、不能令人滿意,“混亂之中的care.data”等字眼也頻繁出現在各大媒體報道中。2014年11月,英國議會中的跨黨派小組(All Party Parliamentary Group)在對care.data項目進行調查后,指責其過程缺乏透明和公共宣傳。2015年1月,NHS的監督機構“獨立信息治理監督小組”也發布報告,說明care.data項目并未完成其承諾,缺少相關專家,以致在信息治理方面存在責任。
由于執行層面中缺乏對病人隱私保護的足夠關注,care.data自始至終沒能獲得公眾的信任。截至今年5月,共有150萬人選擇退出care.data計劃。
care.data的三個問題
總結起來,care.data在實際運作過程中存在三方面的主要問題:首先是管理和溝通方面。在對醫療健康數據集中和統一歸口過程中,有關決策和管理人員強行推動計劃,卻沒有充分告知公眾,或與各利益相關方溝通。在對隱私保護的擔憂日漸發酵時,政府的應對很不及時,也很不充分。
其次是過于依賴技術手段。有關決策和管理人員一遍遍對外強調,收集和共享的數據經過了匿名化或偽匿名化的處理,數據無法回溯到個人,因此不存在隱私泄露的擔憂。但實際上,在大數據環境下,數據很可能經過組合、挖掘,重新識別出個人。同時,數據集中存儲反而導致遭破壞、竊取、泄露等安全風險的上升,care.data計劃的有關決策和管理人員沒能向公眾提供可信的安全方面的保證。
再次是規則方面的準備不足。care.data計劃沒能理順現有規則方面的沖突。一方面家庭醫生具有法律義務保護病人數據的保密性和安全性,另一方面又必須按照要求將數據傳輸至HSCIC。此外,商業機構能夠利用care.data的數據并以此獲利?現有的法律沒有給出答案。
實際上,醫療數據的應用爭議不只是英國特有的情況,比如荷蘭和奧地利等其他歐洲國家,在嘗試集中化處理醫療數據時,也存在大量質疑和反對的聲音。可以說,care.data這三年波折的歷程,我們清晰地看到隨著個人越來越重視隱私保護,隨著數據保護法律法規的日益完善,關于醫療健康大數據的收集和處理過程是否有效保護了各方權益的爭議也會隨之增加。
健康醫療大數據既是惠國惠民、驅動新經濟的重要舉措,也是國家大數據領域應用的試驗田和典范,意義重大。我們很欣喜地看到,國家衛計委副主任金小桃在今年6月17日的新聞發布會中再三強調,“健康醫療大數據的應用發展,最基礎的在安全……對于健康醫療大數據的安全和個人健康醫療數據相關的隱私保護,必須予以高度重視,甚至于它決定著我們大數據應用發展的未來”。
但我們也必須承認,健康醫療大數據應用,不只是將已有的數據和安全保護措施轉移并集中,而是一個前所未有且極其復雜的過程,涉及法律問題、隱私問題、技術問題、責任問題、信任問題,甚至目前還找不到最佳的實踐案例作為參考。因此,要推進好此項工作,迫切需要繼續深入剖析國外案例,分析國內現狀和存在的問題,研究醫療健康數據的全方位保障體系和保障方案,以預防實施中的各類風險,避免出現英國類似的情形。