不同個體的基因組中有99.9%的基因是相同的,正是那0.1%的差異決定了每個人的與眾不同——性別、體貌特征、情緒、甚至是疾病。這些數據對我們個人來說是至關重要的。
2018年,我們看到了太多數據被損壞或者濫用的例子。對于那些想要保護自己基因組信息的人來說,區塊鏈是對現有基因組數據市場封閉架構的一種強大的替代方案。
區塊鏈的用武之地
耗時13年,耗資37億美元的人類基因組測序計劃于2003年完成。現如今,一個人要是想進行基因測序大概只需花費1000美元,而且整個時間也縮短到了幾天。據估計,這一費用很快就會降低到100美元。
隨著基因組數據驅動的藥物設計和靶向治療的發展,制藥和生物技術公司預計將在未來幾年推動基因組數據市場的發展,到2025年這方面的投入將達到276億美元。與此同時,隨著精準醫療和基因編輯技術的革新步伐加快,個體基因中所包含的價值也將呈指數級增長。而且就在過去的一年里,美國還史無前例地批準了新的基因療法。然而,這一過程存在著很多問題。
基因組學在推動現代醫學范式轉變上具有無與倫比的潛力,但它依賴于利用大量的數據集來建立遺傳變異和性狀之間的相關性。而想要獲得大量的基因組數據,不僅面臨著科學上的障礙,也面臨著倫理上、社會上和技術上的障礙。
對于處于這一前沿的許多研究者來說,這正是中本聰在2008年發布的白皮書、以及后來被稱為區塊鏈技術的用武之地。
George Church教授是來自哈佛大學的知名遺傳學家。他多年來一直在努力加速和推動大規模的基因組數據生成。他曾呼吁志愿者為他的非營利組織個人基因組計劃(PGP)做貢獻。PGP相當于一個“維基百科”,它包含開放獲取的大約1萬個人類基因組樣本數據。
PGP依靠人們放棄隱私和數據所有權來追求科學的進步。分享數據的人要么是“特別無私的人”,要么是那些因為家庭經歷而關心某一特定疾病研究的人。
現在基因組學發展的限制在于如何讓所有人都參與進來,據估計,全球大約只有100萬人接受了基因組測序。
為了解決這個問題,一個通證化的、支持區塊鏈的生態系統可能成為向大眾開放的技術引爆點。通過允許人們將自己的基因組貨幣化,并將訪問權直接出售給數據購買者,區塊鏈平臺可以幫助將測序成本降低到“免費甚至可以為人們提供凈利潤”。
通證化為啟用不同的場景提供了靈活性。數據所有者可以根據他們所支持的研究開發任何藥物,或者通過加密貨幣通證來償還他們的醫療處方。相關合同會被公開進行哈希處理,并將個人的同意書記錄在區塊鏈上。
基因組學的窘境
Nebula公司進行的一項調查發現,當人們被問及是否會考慮對他們的基因組進行測序時,隱私和倫理方面的問題遠遠超過了所有其他因素。在另一項對13000人進行的研究中,86%的人表示他們擔心自己的基因數據被濫用:超過一半的人表達了對隱私的擔憂。
今年4月,在Cambridge Analytica丑聞爆出后,有消息稱警探挖掘出了一個業余愛好者的基因組數據庫,其中包含了一些個人DNA片段,他們希望這些片段能幫助破案。
在不知情的公眾上傳的集中存儲的基因材料中,執法部門沒有遇到任何阻力。當許多人通過DNA的糾纏歡呼金州殺手的逮捕時,其他人表達了相當的不安。
這種模糊的訪問權限具有超出了取證的意義。現如今人們擔心雇主和保險公司的基因歧視——后者目前只在法律上被部分禁止。
為基因組學帶來變革的匿名區塊鏈系統
在這個越來越不透明的基因組數據領域中,私人公司將消費者產生的基因型數據貨幣化,而序列數據則分散在專有的、中心化的系統中。
將基因組學引入區塊鏈將允許加速研究所需的時間,同時通過將匿名身份與加密標識分開來保護這種獨特的個人信息。用戶仍然控制著他們的數據,并確切地決定與誰共享數據以及共享數據的目的。反過來,這種訪問將在一個可審計和不可變的分類帳本上被跟蹤。
區塊鏈可以去除醫療領域的病情錯報問題
據稱,23andMe存儲了大約500萬份基因型客戶資料,其競爭對手Ancestry.com存儲了約1000萬份。這些公司針對每一份個人資料會收集大約300個表現型數據,以此來了解你的健康情況和生活習慣。
表現型是個體的一組可觀察的特征,這些特征是個體的基因型與環境相互作用的結果。生成和共享對這些數據的訪問對于通過變異和特征的相關性解碼基因組至關重要。但由于大部分表現型數據都來自于自我報告,現有數據的質量是不確定的。而錯誤的數據會影響醫療研究的效率和準確性。
區塊鏈系統可以提供獨特的機制來阻止欺騙的發生。如果發現某人試圖隱瞞自己的健康狀況,那么他們的加密貨幣存款就會被扣留。
2018年:染色體和區塊鏈
考慮到人體基因組的數據強度,中心化存儲器是無法滿足哪怕是一小部分人的需求。
單個基因組的復雜原始數據集可達200GB。據報道,在2017年6月,美國國家衛生研究院的GenBank擁有超過兩萬億堿基的序列。鑒于基因組的數據龐大,這仍然需要先將其壓縮再寫入到區塊鏈上。而截止到2018年6月中旬,比特幣區塊鏈的平均交易額為423千字節。
今年6月,DNAtix宣布首次使用區塊鏈技術傳輸了一條完整的染色體。Lidsky告訴Cointelegraph,公司已經成功地在今年8月實現了99%的DNA信息壓縮率。
但即使在區塊鏈上,由于基因組學的獨特敏感性,數據傳輸也是不必要和不明智的。一些研究者建議共享數據訪問,該解決方案將區塊鏈與先進的加密技術和分布式計算方法相結合。
加密數據可以提供給所謂的基因組應用程序的開發者,它們還可以為研究人員和其他第三方開發者提供進一步的盈利來源。但是,將基因解釋外包給一個應用程序真的那么簡單嗎?這種有著幾十年歷史的醫療模式讓患者去找遺傳顧問,讓他們檢查風險,討論病情預期,幫助他們解釋可能令人困惑、甚至是害怕的結果。
一些基因檢測公司已經被指責給他們的客戶留下了“大量數據和很少答案”的印象。“23andMe能解釋一系列‘健康’基因,它還能揭示你是否攜帶一種可能影響孩子未來健康的基因突變體,而且截至2017年,它甚至被授權披露包括乳腺癌和帕金森癥在內的遺傳健康風險。”
Nebula和DNAtix都在考慮如何將遺傳咨詢師集成到他們的生態系統中,Grishin還提議用戶可以“選擇”是否真的想“知道基因組結果的一切”,或者僅僅想要“現代醫學能夠解決的病情”。
生物技術前沿
區塊鏈對基因組學的重要性逐漸顯現。既然我們細胞中的DNA被理解為信息的終身存儲者,那么就需要一種新的顛覆性技術來安全地、靈活地管理人體代碼的連鎖網絡。
基因組學的出現提出了僅靠科學無法解決的問題。對于我們所有的受訪者來說,區塊鏈可能是創造公平和透明的所有權和流通方式的關鍵,以確保這些原始的生物信息載體不會被濫用。