加州大學舊金山分校的計算生物學家Dexter Hadley認為,人工智能在檢測乳腺癌等方面可能比醫(yī)生表現(xiàn)得更好,但前提是利用數百萬張乳腺X線影像資料對篩查算法進行訓練。
那么問題隨之而來,如何獲取如此大量的數據?
由于許多國家的隱私政策和法律,醫(yī)療敏感信息在很大程度上仍然是研究人員和科技公司的禁區(qū)。因此,Hadley嘗試了一個徹底的解決方案。Hadley正在與同事構建一個系統(tǒng),讓人們可以輕松、安全地與研究人員分享他們的醫(yī)療數據,并保留對其的控制權。 他們的方法正是基于加密貨幣比特幣的區(qū)塊鏈技術 ,并將很快進行測試。今年5月,Hadley的研究團隊還將開展一項研究,對他們的人工智能算法進行訓練,并以此對乳腺癌進行診斷。其數據將來自通過區(qū)塊鏈分享醫(yī)療信息的300萬~500萬名美國女性。
隨著越來越多的科學家和初創(chuàng)企業(yè)加入該團隊,利用區(qū)塊鏈技術共享醫(yī)學影像圖像、醫(yī)院病歷和基因數據正在變得更具吸引力,而且效率更高。 有些項目甚至會付費給用戶以使用他們的信息。 許多團隊的最終目標是,利用區(qū)塊鏈系統(tǒng)上的數據上對人工智能算法進行訓練。
數據安全
在這些研究人員和公司進行努力的同時, 公眾也越來越關注科技巨頭們如何對個人數據 ,例如一些醫(yī)療信息進行挖掘并獲利 。在2016年,谷歌母公司Alphabet旗下的人工智能公司DeepMind便曾陷入輿論。有新聞報道披露,英國國家衛(wèi)生署的一個分支機構在未經充分同意的情況下,讓該公司獲得了160萬份病歷。其中包括患者的姓名和敏感信息,例如一個人是否患有性傳播疾病。
麻省理工學院的計算機科學家Andrew Lippman說道:"如今,谷歌和Facebook都有一些關于你但你無法控制的數據存儲庫。但在醫(yī)學領域,沒有Facebook。而使用區(qū)塊鏈來保護和分享分散的醫(yī)療信息,可能會成為一種身份數據控制的典范。"
區(qū)塊鏈是一種分布式的電子系統(tǒng),它可以在不斷擴大的"區(qū)塊鏈"中對交易進行記錄,而這一鏈條極難改變。要想闖入一個區(qū)塊,黑客就必須對連接到它的所有區(qū)塊進行獨立的修改,而這無疑是一項艱巨的任務。
在Hadley的研究中,區(qū)塊鏈將作為一系列開關,指導參與者、臨床醫(yī)生和研究人員之間的數據流動。 參與其中的女性將可以通過在線門戶網站breastwecan.org提供或撤銷對其數據的訪問權限,breastwecan.org則依靠區(qū)塊鏈來保護存儲在云中的數據。
研究人員計劃通過數百萬張健康女性和患有乳腺癌女性的乳腺X光線片,對他們的人工智能算法進行訓練。 正如放射科醫(yī)生區(qū)分腫瘤的能力隨著經驗而提高一樣,一種算法的準確性通常會隨著越來越多樣化的數據訓練而提高。研究人員的目標是讓人工智能算法能夠比醫(yī)生更精確地分類腫瘤。
Hadley希望女性們能廣泛分享她們的數據料以改善乳腺癌的篩查技術,并且能夠獲得和控制那些通常由診所擁有的信息。此外,參與這項研究的女性將能夠在breastwecan.org上查看她們的掃描結果,以及根據組織密度、年齡和其他已知因素對其乳腺癌風險的標準臨床解釋。
連鎖反應
隨著區(qū)塊鏈技術的火爆,并非只有Hadley看好了區(qū)塊鏈在健康醫(yī)療數據的前景。其他團體也在挖掘區(qū)塊鏈市場,使個人能夠有償地在公司或研究人員之間進行數據交換。 其中備受矚目的便是Nebula Genomics公司 ,該公司由遺傳學泰斗、哈佛大學遺傳學家George Church聯(lián)合創(chuàng)立。 該公司的目標是把希望分享自己基因組測序數據的個體與愿意為此付費的公司聯(lián)系起來,實現(xiàn)數據共享。 參與者需要支付自己測序費用,并可以在該公司的平臺上出售他們的基因組數據;支付將以數字貨幣的形式完成,當然數字貨幣也可以兌換成真金白銀。
Church曾表示,Nebula Genomics會確保其合作伙伴公司所做的任何承諾,比如公司保留數據的時限等。相比之下,在23andMe等基因組測序公司用戶同意分享個人數據時,用戶在很大程度上等于放棄了對自身數據使用方式的控制權。實際上,許多測序公司將匿名的基因數據批量出售給生物技術和制藥公司。
Lippman談道, 讓公眾對自己的健康醫(yī)療數據有更多的控制權,也能產生更直接的健康效益。 Lippman和他的研究生們已經開發(fā)出一個基于區(qū)塊鏈的系統(tǒng),用于共享健康醫(yī)療數據,名為"MedRec",并將于今年在位于波士頓的貝斯以色列女執(zhí)事醫(yī)療中心進行測試。該系統(tǒng)允許用戶將更多信息插入到健康病歷中,包括來自可穿戴電子設備的數據。臨床醫(yī)生和研究人員可以在獲得許可的情況下使用這些額外數據來調整治療方案。
最后,Hadley強調,醫(yī)生收集的大量常規(guī)醫(yī)療數據只有在信息共享和研究的情況下,才能取得醫(yī)學上的進步。"我們需要讓人們參與進來,讓人們向我們分享其數據。因此,我們需要從醫(yī)學角度審視我們擁有的良好數據管理技術,而區(qū)塊鏈恰好就是其中之一。"