大數據能為我們人類帶來哪些好處?
舉個直觀的例子:我們知道人類的一些疾病與基因組異常有關。例如唐氏綜合癥、透納氏癥和許多其他疾病,是染色體的不分離現象所造成。同樣,癌細胞中的染色體則頻繁地出現非整倍性現象等等。
顯然,研究基因組,并讓每一個人檢測并了解自己的基因組,有著非常現實的意義——如果能發現所有人類基因并搞清其在染色體上的位置,破譯人類全部遺傳信息,就能使人類在分子水平上全面地認識自我,從而規避各種疾病的困擾,改變自我。
但是,人類基因組DNA有多達30億個堿基對的序列,這就意味著巨大的數據量。還好,今天的科技憑借云計算、大數據的能力越來越強,由于x86架構的計算和存儲成本的大幅度降低,如今檢測并計算分析一個人的基因組,已經從13年38億美元,下降到了120小時幾千美元。
如今云計算供應商還在大數據處理能力上不斷實現突破。比如今年上半年,經過阿里云深圳團隊不斷摸索,千人基因組的分析,原來要做幾個月,如今的記錄還不到一天,花了僅僅21小時47分12秒。
在技術日新月異的今天,阿里云、英特爾、華大基因三方聯手,其目標是在2020年以前,在24個小時之內完成一個人全基因組的測試、分析,并將成本控制在2000人民幣以內。
這樣的結果,直接導致了生命科學已經從科學研究的殿堂,即將步入醫療的臨床,從而改變現今傳統醫療手段,顛覆整個醫學界的治病模式。
不僅如此,生命科學的范疇并不僅僅是我們人類自身,也包括和人類相關的食品,從蔬菜、水果、水稻、小麥到動物。
也正是因為此,德國醫藥和農化巨頭拜耳公司今年提出將以620億美元全現金方案收購美國轉基因種子和農化巨頭孟山都。目前孟山都拒絕了這一收購要約,因為這筆交易一旦達成,不僅將成為德國企業史上最大的對外收購交易,而且也將徹底改變歐盟和美國之間對于未來生命科學的主導權。
與此同時,生命科學和現代農業領域的另一大并購案,也在緊鑼密鼓的進行中:中國化工提議以每股470瑞士法郎(約合3069元人民幣)現金收購全球第一大農化和植保公司及全球第三大種子公司——瑞士先正達70%股份。
如今,不論是先正達還是孟山都,都從農業化學公司發展到目前具有“植保+種子+農技服務”一體化作物綜合解決方案的提供商,而拜耳和中國化工的收購要約,也顯示出這兩家醫藥、化工和農化領域科技巨頭的下一步發展方向。
很明顯,科技領域正在面臨洗牌重組的行業產業不僅僅是IT,同樣包括農化、醫療、農化等所謂的生命科學領域。
這些,都拜托大數據的價值再造——為整個行業帶來顛覆性的革命。
事實上,即便是一顆草也有基因,而且跟我們人類的基因有17%是一樣的;一只蒼蠅,有40%基因和人類是共享的;一條魚與人類相同的基因竟然高達63%;到了經常被用作生命科學試驗的小白鼠,其與人類共享的基因已經達到80%;而大猩猩與我們人類同質化基因高達96%。到了人類自身,無論是男人女人、黑人白人,人類在生物學上就一種,人與人的差異只有0.5%。
別小看這0.5%。你的拇指是直的還是彎的,舌頭能不能卷起來,喝牛奶會不會拉肚子,酒量大小的差異,這些都是基因決定的。是基因和自然選擇決定了你對乳糖的耐受,因為歐洲人和蒙古人在數千年前比中國人更適應游牧生活,從牛奶中獲取與農作物同樣的營養。
在生命科學中,唯一不例外的就是例外,它總會發生,比如一個媽媽生出來的異卵雙胞胎,長得很像,但是膚色不同,這個概率只有幾百萬份之一。這樣的突變,使得我們的基因變得越來越豐富和多樣,也使得每一個人的基因有了那0.5%的差別。或許有一天,因為基因組的測試分析變得更容易和更低成本,你在社交軟件中就可以跟朋友對比你的基因,說哪些基因好,哪些基因弱爆了。
這就是數據的價值。大數據可以幫助我們終結很多疾病,比如從NIPT數據中,我們可以發現孕期腫瘤的蹤跡,我們還可以比對遺傳病的分子流行病學數據庫,找到BRCA2突變位點的頻譜分布,從而有效控制腫瘤、癌癥的發生;大數據也可以幫我們改變體內腸道的菌群生態,讓我們從肥胖癥中,恢復健康。
一句話,當每一個人都有自己的基因數據的時候,這個世界帶給我們的生物醫藥的領域是完全不同的——大數據將帶來健康革命。