新材料哺育新發(fā)明。Gorilla Glass 已經(jīng)大量被應用于智能手機;凱夫拉在拯救生命之余開始進入消費級產(chǎn)品;鋰離子電池技術為高能耗設施提供了動力來源。但是,研發(fā)新材料卻是一項極其費時費力的任務。
創(chuàng)造一種全新的突破性材料是極其費時的過程 – 尤其是和那些依賴這些材料的產(chǎn)品的研發(fā)周期相比。波音 787 夢幻客機從概念到商業(yè)航行只花了 9 年不到;蘋果從 2005 年開始設計 iPhone,2007 年就可以正式上市。作為對比,新型材料的誕生可能要花上長達 20 年的研究和實驗。
兩年前,美國政府以突破這個科技瓶頸為目標,成立了Materials Genome Initiative(MGI)項目。MGI 的目標是大幅減少新材料研發(fā)所需的時間和財力投入。和人類基因組計劃為我們的基因繪制地圖的任務類似,科學家想要通過 MGI 找出元素間的互相作用對材料的種類和性質(zhì)帶來的廣泛影響。以這些知識作為基礎,科學家和工程師們將有希望以更短的周期為不同應用“定制”相應的材料。
元素間排列組合的數(shù)目多如牛毛,其中大多數(shù)對我們來說沒有意義。而試圖在實驗室里窮盡這些排列組合是完全不合實際的。所以,MGI 的一些項目組已經(jīng)開始借助大數(shù)據(jù)的力量來模擬所有的可能性,然后通過分析數(shù)據(jù)向有潛力的方向進行深入研究。
立多年以來,MGI 促成了一些第三方項目的合作。其中就有來自麻省理工學院的Materials Project和哈佛的Clean Energy Project。這兩個計劃以相似的理論基礎尋求不同的答案。前者的研究集中在無機固體上,尤其以電池材料為主,而后者的清潔能源計劃以可用于太陽能電池的分子材料為中心。兩者均利用密度泛函理論(Density Functional Theory)收集的巨型數(shù)據(jù)庫來預測模擬物質(zhì)模型的實際屬性。
MIT 的 Material Project 大約在 8 年前在 Gerbrand Ceder 教授的幫助下成立。作為多家公司的顧問,Ceder 積累了大量成果。但是和少數(shù)公司的合作使得這些寶貴數(shù)據(jù)被封閉起來。“如果我們向所有人提供這些數(shù)據(jù),人們會創(chuàng)造出很多驚人的成果,這就是 Materials Project,”他說。目前, MIT 的數(shù)據(jù)庫里保存了大約 10 萬種已知或理論上的材料信息。為了充分發(fā)揮這些數(shù)據(jù)在新材料研發(fā)中的作用,MIT 學者用人工篩選加機器學習的方式來探索各種化學定律。
類似的,哈佛清潔能源計劃也用人工加機器組合來探索其數(shù)據(jù)庫。該計劃始于一次對有機太陽能電池材料概念的驗證實驗。學者們完全虛擬的情況下計算了大約 15 種新型混合物在現(xiàn)實世界里的表現(xiàn)。模擬運算的最終結果是一種有超強電氣性質(zhì)的新物質(zhì)。這還只是一名研究生通過幾次實驗得出的結果,想象如果從一支志愿者大軍那兒借來他們的運算能力,結果會放大多少?
這正是清潔能源計劃如今采用的策略:任何人都可以通過在電腦上下載一個程度來進行運算并把返還結果。有了這個可任意支配的巨大資源,學者們已經(jīng)計算了幾百萬種潛在組合 – 這僅僅是個開端。“項目進入了一個十分有趣的階段”Hachmann 博士說,“對我們來說差不多是從辛勤勞動中采集碩果的時候了。”目前,哈佛在網(wǎng)上發(fā)布了230萬種混合物組合供所有人研究使用。雖然這些數(shù)據(jù)的初衷是助力太陽能電池的研發(fā),科學家也可用任何有價值的信息來幫助其它方面的研究。MIT 也有個網(wǎng)絡入口供人們讀取 Materials Project 的數(shù)據(jù)。
Ceder 希望偉大的 MGI 計劃能夠完成它的使命。事實上,Ceder 已經(jīng)看到一些成果了,他正在為一項新的電池材料申請專利,這對于成長中的 MGI 和電池技術開發(fā)來說都是很好的成績。Ceder 認為互聯(lián)網(wǎng)和大數(shù)據(jù)的加入能為這個計劃帶來無法預知的進步和發(fā)現(xiàn),“當擁有這種組合的時候,你無法預測人們將會帶給你什么。”