谷歌聯合創始人謝爾蓋·布林(Sergey Brin)經常練習跳水。“跳水這項運動短暫而劇烈,”他說。“可以馬上提高心跳速率。”
但跳水對他來說還有另外一個好處。從家族遺傳學的角度來看,布林患上帕金森癥的風險很高,而每跳一次水,這種風險就會減少一點點。在布林身體的每個細胞內,12號染色體的LRRK2基因都存在一種基因突變,它與帕金森癥的發病率關系密切。
不是每個有這種基因突變的人都會患上帕金森癥,但它確實增加了患病機會。普通美國人患這種病的風險約為1%,但有這種基因突變的人患病率達到30%-75%。從布林本人的DNA來看,他患病的可能性是50%。所以他采取了一些保養措施,運動、喝咖啡、喝綠茶……用環境因素來抵消DNA的影響。
他說,“飲食、運動這些方法,可以讓我的患病風險下降一半,到25%左右。”他覺得,神經科學的穩步發展,會把這種風險再降低一半,把可能性降至13%左右。雖然這些是推測,不過他解釋得有理有據,讓人信服。
當然布林絕不是普通人,他擁有百億美元身家,這為他提供了額外的好處。自從知道自己攜帶LRRK2基因突變之后,布林捐獻了至少 5000萬美元給帕金森癥研究活動,他認為這筆錢可以“真正改變局面”。隨著研究活動的增多,布林再次調整了自己的整體患病風險,“風險下降到10%以下。”這仍然普通美國人的10倍水平,但已經比他本身50%的患病風險下降了很多。
谷歌風格的科學
這聽起來如此務實,如此顯而易見,差點讓大家忽視了一個驚人的事實:很多慈善家都資助了某些疾病的研究,他們自己也被診斷出患有這些疾病。但是,布林可能是第一個基于基因測試而捐獻科研經費,希望自己避免患上某種疾病的人。
布林的做法值得注意還有另一個原因。這不僅是一種公益科研創投,而且布林是在尋求一種完全不同的科學。大多數帕金森癥研究工作,就像一般醫學研究一樣,依靠的也是傳統的科學方法:假設、分析、同行評審、發表論文。但布林提出了一種不同的方法,使用計算能力和海量數據集來推動研究。這種方法來源于他對算法的理解,帶有谷歌那種對計算能力的信心,目的是加快科研步伐,增進科研潛力。 “我已經習慣了互聯網界,在我看來,醫學界的研究步伐簡直和冰川移動一樣緩慢,”布林說。“我們可以查找很多東西,收集大量信息。如果能發現一個模式,就有可能找到出路。”
換句話說,布林希望另辟蹊徑,繞開盛行了幾個世紀的科學認識論,轉向一種更具谷歌風格的科學。他想先收集數據,再假設,然后發現有價值的模式。而且他也擁有足夠的資金和算法武器來做到這一點。
家族遺傳
布林對數字的信心,對“知識就是力量”的信心,來源于家族傳承,他的父母都是俄羅斯裔科學家。布林的母親在1996年出現一些癥狀時,聯想到自己姑媽患上帕金森癥的經過。但當時科學界認為帕金森氏是不會遺傳的,所以布林并不理解母親的擔心。 “我認為她想太多了,太不理性。”他說。然而經過進一步的測試之后,布林的母親在1999年被診斷出患有帕金森癥。
LRRK2基因突變和帕金森癥的關系是在2004年發現的。2006年,布林的妻子安妮·沃西基(Anne Wojcicki)創辦了個人基因公司23andMe(谷歌是投資者之一)。布林作為alpha測試者,很早就看到了自己的基因組結果。不久23andMe公司就發現,布林和他母親都有LRRK2基因突變。
布林沒有驚慌。他花了數個月來考慮此事,請教專家。但很快,他就意識將這件事保密是不切實際的。布林說,“我還不如公開此事,這個信息似乎是值得分享的,甚至可能是有趣的。”所以在2008年9月的一天,布林開了博客。第一篇文章直接就叫《LRRK2》。
有毒的知識?
從某種意義上說,我們一直在使用遺傳學來預知自己患上疾病風險。當我們談論家族病史時,我們主要談論的是DNA,是對于我們自身的健康而言,父母的健康狀況提供了什么線索。遺傳掃描只不過是一種更現代的方式,來把我們的家族歷史和我們的未來可能性聯系到一起。
但是DNA檢測如此精確,可能會讓人覺得化學物質決定了命運,覺得它包含著黑暗的、冷酷無情的秘密。這就是為什么基因信息有時被說成是“有毒的知識”的原因。用斯坦福大學生物倫理學家漢克·格里利(Hank Greely)的話來說,讓人們可以直接訪問自己的遺傳信息,是徹頭徹尾的“魯莽之舉”。
在科學發展的早期,這倒也有幾分真實。但出人意料的是,基因信息“有毒”的觀念一直延續至今,可能是因為它假設人們缺乏自我了解的秉性。但研究表明這種假設是沒有根據的。
一項關于阿爾茨海默氏癥的研究稱,在告知人們患病風險較高的壞消息時,“預期人們會做出災難性的反應。抑郁癥、自殺、辭掉工作,拋棄家庭。研究者想到了最壞的狀況。”
但是事實與之相反。那些被告知阿爾茨海默氏癥患病風險較高的人,似乎能用正能量來處理這件事,在后來的生活中,他們往往選擇了更加健康的生活方式。 “人們會去應對問題,似乎并沒有產生任何明顯的抑郁癥狀。”
換句話說,對于看起來非常糟糕的消息,我們大多數人都會像謝爾蓋·布林那樣去應對:研究一下我們究竟有哪些選擇,尋求建議,然后繼續生活。 “每個人都面對著自己的挑戰;每個人都有自己的問題要處理,“布林說。“這就是我的挑戰。它不過是我老了之后需要面對的諸多問題之一。最重要的是,我能對此做些什么?”
隨著布林對帕金森癥的日益了解,在與沃西基探討研究模型時,他意識到有一個更大膽的實驗正在醞釀之中。
阿司匹林的教訓
1899年,拜耳的科學家推出了阿司匹林。這種藥對感冒、腰痛和牙痛效果很好,但是它的作用機制當時并不清楚。
直到20世紀60、70年代,科學家才開始逐步弄清阿司匹林的作用機制:阿司匹林可以抑制人體內一種名為前列腺素的化學物質,而前列腺素會引起炎癥和疼痛。明白了這一點,后來的一個發現就非常容易理解了:1988年時,人們發現,隔天服用阿司匹林能夠明顯降低心肌梗塞。因為阿司匹林抑制了前列腺素,抑制了血栓的形成,因此也就降低了心肌梗塞或中風的風險。
阿司匹林的“二次發現”,被認為是當代醫學研究的成就之一。但布林認為,我們應該從這件事中總結出另一個教訓——在阿司匹林最初推出之后,到人們發現它和心臟疾病有關系之前的那數十年里,“有數以百萬計的人服用阿司匹林,獲得了額外的健康益處。”但這些益處與阿司匹林之間的關系被忽視了,因為沒有人去關注這些病人。“所有的數據都丟失了,” 布林指出。
“購物籃分析”的力量
以布林的思維方式來看,我們每個人的生活都可以為科學洞見做出貢獻。我們平常過日子,做出各種選擇、吃東西、服藥、做這樣那樣的事情——產生了所謂的“數據廢氣”(data exhaust)。在一個世紀前,你當然不可能真正利用這種信息的價值,特別是沒有一個具體的假設來指導研究人員在尋找什么東西的時候。但是今天,利用現代計算能力,研究者可以對這些數據進行跟蹤和分析。 “我們擁有的任何經歷,或服用的任何藥物,都是個人的信息片段,”布林說。 “單獨來看它們沒有什么價值。但綜合起來,它們可以變得非常有用。”
在計算機科學中,挖掘這樣的大型數據集來找到有用的關聯,這個過程被稱為購物籃分析(Market Basket Analysis),常常被用于零售購買模式的推導中。比如亞馬遜就用它來告訴你,“購買X商品的用戶也購買了Y商品”。
布林在斯坦福大學讀書時,就對這個領域進行了研究。他在1997年的一篇論文中說,只要有了正確的算法,你可以從各種非常規的“購物籃”中找到有意義的關聯。“不夸張地說,我們的患病經歷就可能是其中之一。”
布林對“噪音數據”有很大的容忍力,這一點特別能說明問題,因為醫學界傾向于認為“噪音數據”不是好事。生物醫學研究人員往往把實驗限制在可以嚴格測量的問題上。但強調純度就意味著可供研究的病人數量比較少,也就會導致數據集的規模比較小,從而限制了研究的“power”,即發現結果為真的概率。
但是,越來越多的科學家,特別是那些有計算和信息理論背景的科學家覺得,這種研究模型是可以反轉的。為什么不從海量的數據出發,來尋找模式和關聯呢?
科學的第四范式
已故的微軟研究人員、計算機科學家吉姆·格雷(Jim Gray)把這稱為“科學的第四范式”,從假設向模式演化是一個必然進程。格雷預測,在各個學科領域,科學家會被數據洪水包圍,除非他們重新界定科學過程的概念,并使用大量的計算工具來處理數據。“科學世界已經改變了,”格雷在2007年的演講中說。從現在開始,排在首位的將會是數據。
格雷的老東家比爾·蓋茨(Bill Gates)也在“第四范式”上壓下過一筆小賭注:波特蘭一家公司運用大型計算來快速模擬傳統藥物研究的試錯法,蓋茨向其投資了 1000萬美元。
謝爾蓋·布林當然不是普通人。有多少人擁有足夠的資源來扭轉科學的曲線?又有多少人的配偶創辦過基因學公司?布林不僅擁有這樣的條件,而且他本人也有一種以數據為驅動力的思維方式,所以在談到基因知識的時候,他可能比我們大多數人都更加淡定。很少有人會把自己的困境當作契機,促進一種新科學的發展,這是布林的與眾不同之處。
但是我們之中的一些人,可能有一天也會面對布林那樣的挑戰,發現自己屬于某種無藥可治的疾病的高風險人群。然后我們會更多地進行鍛煉,開始吃不同的食物,做出各種努力,同時等待科學研究的發展。從這個角度來說,布林的故事不僅僅是一個億萬富翁的故事,也是每個人的故事。