例如,科學(xué)家們更多地依賴大數(shù)據(jù)在生物學(xué)方面進(jìn)行新的定量發(fā)現(xiàn),例如基因組,微生物組,個(gè)性化醫(yī)學(xué)和疾病建模。利用當(dāng)今的技術(shù),科學(xué)家們能夠生成有關(guān)細(xì)胞或生物體的完整基因,蛋白質(zhì),RNA譜,代謝物以及更為人所知的原子數(shù)據(jù)的數(shù)據(jù)。利用omic數(shù)據(jù),科學(xué)家們可以對(duì)復(fù)雜的生物相互作用進(jìn)行建模,并對(duì)不同的細(xì)胞過(guò)程有更全面的了解。但挑戰(zhàn)在于分析和理解這些大型數(shù)據(jù)集。
“在進(jìn)行大數(shù)據(jù)分析時(shí),重要的是要了解所有這些不同的數(shù)據(jù)類型是如何相關(guān)的。現(xiàn)在我們有一種方法可以連接多種不同的數(shù)據(jù)類型來(lái)生成生物學(xué)問(wèn)題的基本答案,”Galetti生物工程教授Bernhard Palsson說(shuō)。加州大學(xué)圣地亞哥分校雅各布工程學(xué)院和該研究的高級(jí)作者。
“雖然所有這些數(shù)據(jù)類型都是從同一個(gè)單元格派生出來(lái)的,但它們代表了以不同規(guī)模發(fā)生的過(guò)程。我們的工作是讓多個(gè)不同的數(shù)據(jù)類型同步,以便我們能夠理解這些過(guò)程的協(xié)調(diào)并從中獲得意義,” Elizabeth Brunk,Palsson實(shí)驗(yàn)室的博士后研究員,也是該研究的共同第一作者。
這項(xiàng)研究是解決國(guó)家衛(wèi)生研究院提出的一項(xiàng)名為“知識(shí)大數(shù)據(jù)”的重大挑戰(zhàn)的一部分 - 將大型復(fù)雜的生物數(shù)據(jù)集轉(zhuǎn)化為可以基于基本原理理解的信息。
在這項(xiàng)研究中,研究人員從不同生長(zhǎng)環(huán)境中生長(zhǎng)的大腸桿菌中收集了多種數(shù)據(jù)類型(RNA序列,核糖體譜,蛋白質(zhì)數(shù)據(jù),代謝數(shù)據(jù))。然后,該團(tuán)隊(duì)將這些不同的數(shù)據(jù)類型整合到下一代基因組規(guī)模的代謝模型中,這些模型是在Palsson的實(shí)驗(yàn)室中開(kāi)發(fā)的。
他們檢查了原子數(shù)據(jù)類型之間的關(guān)系,發(fā)現(xiàn)了新的規(guī)律,這是環(huán)境變化的生物一致性。他們發(fā)現(xiàn)的規(guī)律之一是,在蛋白質(zhì)翻譯過(guò)程中,核糖體始終在信使RNA轉(zhuǎn)錄本上的特定位點(diǎn)停留,并且這些暫停位點(diǎn)決定了蛋白質(zhì)的三維結(jié)構(gòu)。
Palsson解釋說(shuō),暫停位點(diǎn)的存在使得蛋白質(zhì)有時(shí)間折疊并形成其整體形狀,這對(duì)蛋白質(zhì)正常運(yùn)作很重要。這些知識(shí)對(duì)于研究癌癥生物學(xué)非常有用。如果腫瘤具有消除暫停位點(diǎn)的基因突變,則翻譯將產(chǎn)生不能正確折疊并且發(fā)生故障的蛋白質(zhì)。
帕爾森說(shuō):“現(xiàn)在我們對(duì)這些我們以前沒(méi)有過(guò)的暫停站點(diǎn)有一個(gè)基本的解釋。就好像我們正在以一定的節(jié)奏目睹錯(cuò)綜復(fù)雜的舞蹈,以確保蛋白質(zhì)以正確的方式形成。”
該團(tuán)隊(duì)還開(kāi)發(fā)了所謂的參數(shù)化模型,該模型可用于預(yù)測(cè)當(dāng)細(xì)胞經(jīng)歷環(huán)境變化時(shí)表達(dá)哪些基因。
“由于Palsson博士實(shí)驗(yàn)室開(kāi)發(fā)的基因組規(guī)模模型中提供的高質(zhì)量拓?fù)湫畔ⅲ覀兛梢愿玫亓私饣颍鞍踪|(zhì)和代謝物之間的聯(lián)系,并將多元數(shù)據(jù)置于這些生物化學(xué)的背景中網(wǎng)絡(luò),“布蘭克說(shuō)。