近期,Brain雜志發表了一篇文章,針對近期十分熱門的大數據研究發表了評論;以阿爾茨海默病作為例子,陳述了大數據研究的可能利弊,指出需要清醒地看待,而不應該過于樂觀和狂熱。評論全文編譯如下:
在21世紀之交,人們回顧生物醫學科學的歷史,人們的焦點不免轉向了癡呆,尤其是阿爾茨海默病(AD)。我們這一代的腦科學家們和臨床醫生該如何處理這個全球性的健康問題?我們做了正確的選擇嗎?還是我們似乎不足夠悲痛,我們的判斷太過于天真?
其中一項值得仔細考慮的策略是對大數據的投資。近年來在阿爾茨海默病領域已顯現了對“大數據”的關注熱情,這反映了一種普遍的驅動力,可能也會刺激醫學和其他行業學科的發展。從商業到政府層面,大數據似乎給許多的問題都提供了解決的可能性。然而,也并不是每個人都認為這樣,有關其是非曲直的爭論也十分激烈。
這種反思對于神經科學可能是有益的。人類腦計劃旨在通過超級計算機模擬人腦功能,近期對其的關注顯示了某些大數據計劃已經成為爭議的焦點了。在歐盟約10億歐元資金的支持下,該項目是一項巨大的投資,但其可能的回報的大小以及治療仍是存在許多疑問的。
對于腦部疾病,阿爾茨海默病是很好的例子。效仿阿爾茨海默病神經影像學研究(ADNI)之后今年又啟動了一項新的研究。ADNI有很好的數據共享和發表文章的記錄,同時也能從廠家吸引投資和資助,迄今已有共2億美元的投入。
今年早些時候,世界經合組織(OECD)發布了一項報告,是關于情報學和“大數據在加速神經變性疾病研究全球性創新中成為游戲規則的改變者的潛能”。接下來又發表了阿爾茨海默病大數據夢想挑戰:這是一項大型的合作性開放性科學研究,旨在明確AD的生物標志物。這些研究項目不僅僅只是為了建立大型的數據庫,也是為了更好地開發分析工具進行更有效地利用這些數據。
本刊《Brain》在展示這些研究發現的方向方面發揮了重要作用。我們渴望反映這些最好的科學進步,但同時我們也希望引發和鼓勵爭議。盡管我們沒有洞悉未來的天賦,但我們可以思考大數據的真實的潛能是什么。就像普通路人一樣去發問:它能治愈阿爾茨海默病嗎?是否“夸大”了答案?
大的數據收集是有用的,這不是問題。這些巨大數據收集起來的實用性是毋庸置疑的。但是這些收集的數據實際上能解釋什么嗎?這是目前爭議的核心:大數據的解釋功效是什么?
新方法的狂熱者反駁說“大數據是有關是什么的,而不是為什么。我們不是總需要知道一種現象的原因,而是我們讓數據本身說話”。在許多時候是鼓勵讓數據本身說話的,但這也存在很大的風險,就是我們并不能搞清楚這些大量數據信息的真正含義。即使我們懂了,除了相關性之外還有什么呢?它能解釋病因機制嗎?似乎不能。
但阿爾茨海默病大數據研究的支持者可能會說,在我們理解它意味著什么之前需要首先找到“信號”。的確,它們可能指出了傳統科學無法揭示的基因學和分子學機制,但這些方法并不能夠足以解釋千變萬化的臨床表現。
也許有關大數據的爭論暴露了神經科學研究中一些重要的普遍性問題。不同地區的專家不同研究中的方法可能不同,因此大數據的優點之一可能在于能將不同水平的數據集中到一起——從基因到分子,從影像到認知功能——從而暴露研究中缺乏綜合性的缺點。從這個意義上說,大數據可能提供了一個洞悉重點和管中窺豹的機會,而不僅僅只是將我們的視野局限于我們最熟悉的那一部分。
不管利弊,大數據的研究方法已經存在了。我們應將其開發至最大化,盡量利用好,同時也要知道其局限性之所在,而不僅僅只是呼吁說“小即是美”。