為了馴服生物實驗室辛苦得出的數據洪流,美國國立衛生研究院(nih)近日宣布,今年投資3200萬美元設立一個獎項,以推動研究人員開發分析和使用生物學大數據庫的方法。
該獎項出自nih去年啟動的大數據知識(bd2k)創新計劃。nih認為應當投入更多資源幫助使用不斷增長的數據集——生物醫學研究者積累的基因、蛋白質和患者檔案等數據。例如,在一個“干生物學”項目中,研究人員將細胞基因表達的公共數據和患者檔案混合在一起,預測現存藥物的新用途。
bd2k獎項“將幫助我們克服最大化利用數據洪流面臨的障礙,而且目前數據積累速度正在加速。”nih院長franciscollins在新聞發布會上說。他表示,這些獎金將資助開發計算工具、軟件、標準和方法,用于分享和使用大數據集。
在未來4年里,11個卓越創新中心每年將收到200萬~300萬美元,開發從建模癌癥細胞信號到整合移動傳感器數據等各個方面所需的方法和工具。另一個獎項將資助名為enigma的全球腦數據收集工作,從而發掘精神疾病的遺傳根源。
最近加入enigma項目的佛蒙特大學認知神經學家hughgaravan表示,長期以來,神經影像研究也在與數據不足作斗爭。他提到,約“95%的影像學研究可能每組有20個參與者”,主要原因是腦掃描成本——每人約為500~600美元。garavan研究小組則計劃使用數據池探索成癮性的基因和神經生物學基礎。
另一方面,盡管大數據集增加了獲得假陽性結果和錯過稀有變體的概率,但總體而言,數據池策略“非常有意義”,西雅圖兒童醫院精神病學家jackmcclellan說。
bd2k項目還將資助加州大學圣迭戈分校建立一個“數據探索”協調中心,該中心將與其他8個機構聯合開發,從而幫助研究人員更容易地發現和使用數據集。