來(lái)自美國(guó)能源部斯坦福直線加速器中心(SLAC)和費(fèi)米國(guó)家加速器實(shí)驗(yàn)室的科學(xué)家,在8月2日發(fā)表于《自然》雜志的一篇文章中,總結(jié)了機(jī)器學(xué)習(xí)在粒子物理學(xué)領(lǐng)域的當(dāng)前應(yīng)用和未來(lái)前景。
該論文共同作者、美國(guó)威廉瑪麗學(xué)院的亞力山大·拉多維奇說(shuō):“機(jī)器學(xué)習(xí)算法自己知道如何進(jìn)行各種分析,這有望為我們節(jié)省無(wú)數(shù)小時(shí)的設(shè)計(jì)和分析工作。”拉多維奇目前正參與費(fèi)米實(shí)驗(yàn)室的NuMI離軸中微子實(shí)驗(yàn)(NOVA)。
機(jī)器學(xué)習(xí)篩查大數(shù)據(jù)
機(jī)器學(xué)習(xí)已被證明在分析領(lǐng)域非常成功。為了處理像在LHC內(nèi)進(jìn)行的那些現(xiàn)代實(shí)驗(yàn)中產(chǎn)生的海量數(shù)據(jù),研究人員應(yīng)用所謂的“觸發(fā)器”——專(zhuān)用的硬件和軟件,它們能實(shí)時(shí)決定哪些數(shù)據(jù)可保存下來(lái)以供分析,哪些數(shù)據(jù)可以丟棄。
論文作者之一、麻省理工學(xué)院的邁克·威廉姆斯說(shuō),機(jī)器學(xué)習(xí)算法至少可由做出其中70%的決定。威廉姆斯目前正參與LHCb實(shí)驗(yàn),該實(shí)驗(yàn)可幫助科學(xué)家揭示為何宇宙中物質(zhì)的數(shù)量遠(yuǎn)遠(yuǎn)多于反物質(zhì)的數(shù)量。
LHC中巨大的超環(huán)面儀器(ATLAS)與緊湊渺子線圈(CMS)能發(fā)現(xiàn)希格斯玻色子,每個(gè)探測(cè)器都有數(shù)百萬(wàn)個(gè)傳感元件,其信號(hào)需要放在一起才能獲得有意義的結(jié)果。SLAC的邁克爾·卡根說(shuō)道:“這些信號(hào)組成了一個(gè)復(fù)雜的數(shù)據(jù)空間,我們需要了解它們之間的關(guān)系,得出結(jié)論,例如,探測(cè)器中某個(gè)粒子的軌跡是由電子、光子還是其他東西產(chǎn)生。”
中微子實(shí)驗(yàn)也受益于機(jī)器學(xué)習(xí)。NOVA研究了中微子在穿越地球時(shí)如何從一種類(lèi)型轉(zhuǎn)變?yōu)榱硪环N類(lèi)型,這些中微子振蕩可能潛在地揭示一種新類(lèi)型中微子的存在,一些理論認(rèn)為,這種中微子是暗物質(zhì)的粒子。NOVA的探測(cè)器正在監(jiān)視中微子撞擊探測(cè)器材料時(shí)產(chǎn)生的帶電粒子,并且,機(jī)器學(xué)習(xí)算法可以識(shí)別它們。
識(shí)別特征 進(jìn)行模擬
機(jī)器學(xué)習(xí)算法日益復(fù)雜和精細(xì),為解決粒子物理問(wèn)題開(kāi)辟了前所未有的機(jī)會(huì)。機(jī)器學(xué)習(xí)的最新發(fā)展——所謂的深度學(xué)習(xí),即使用神經(jīng)網(wǎng)絡(luò),改進(jìn)了粒子物理學(xué)家們的實(shí)驗(yàn)方式。
卡根說(shuō),他們可以使用深度學(xué)習(xí)的許多新任務(wù)都與計(jì)算機(jī)視覺(jué)有關(guān),“它與面部識(shí)別相似,只是在粒子物理學(xué)中,圖像特征比耳朵和鼻子更抽象。”
像NOVA這類(lèi)實(shí)驗(yàn)產(chǎn)生的數(shù)據(jù)很容易轉(zhuǎn)化為實(shí)際圖像,AI可以很容易地從中識(shí)別特征。拉多維奇說(shuō):“即使數(shù)據(jù)看起來(lái)不像圖像,如果能夠以正確的方式處理數(shù)據(jù),我們?nèi)匀豢梢允褂糜?jì)算機(jī)視覺(jué)方法。這種方法非常有用的一個(gè)領(lǐng)域是,對(duì)大型強(qiáng)子對(duì)撞機(jī)產(chǎn)生的大量粒子射流進(jìn)行分析。”
深度學(xué)習(xí)的另一個(gè)新興應(yīng)用是粒子物理學(xué)數(shù)據(jù)的模擬,如預(yù)測(cè)LHC中的粒子碰撞會(huì)發(fā)生什么,并與實(shí)際數(shù)據(jù)比較。傳統(tǒng)模擬通常很慢且需要巨大的計(jì)算能力,而AI可以更快地進(jìn)行模擬。
卡根說(shuō):“雖然這是非常早期的工作,但它顯示出許多希望,并可能有助于應(yīng)對(duì)未來(lái)的數(shù)據(jù)挑戰(zhàn)。”
質(zhì)疑促進(jìn)進(jìn)步
盡管有明顯進(jìn)步,但機(jī)器學(xué)習(xí)愛(ài)好者經(jīng)常需要面對(duì)來(lái)自合作伙伴的質(zhì)疑,部分原因是機(jī)器學(xué)習(xí)算法大多數(shù)時(shí)候就像“黑匣子”,很少能提供關(guān)于它們?nèi)绾蔚贸瞿硞€(gè)結(jié)論的信息。
威廉姆斯認(rèn)為:“質(zhì)疑是好事,如果你將機(jī)器學(xué)習(xí)用做丟棄數(shù)據(jù)的觸發(fā)器,就像我們?cè)贚HCb中所做的那樣,那么你需要非常謹(jǐn)慎并設(shè)置非常高的標(biāo)準(zhǔn)。因此,在粒子物理學(xué)領(lǐng)域建立機(jī)器學(xué)習(xí)需要不斷努力,以更好地理解算法的內(nèi)部工作原理,并盡可能地與實(shí)際數(shù)據(jù)進(jìn)行交叉檢查。”
論文共同作者、工作于MicroBooNE中微子實(shí)驗(yàn)的SLAC研究員寺尾一寬(音譯)說(shuō):“在應(yīng)用AI方面,我們應(yīng)該不斷嘗試,并始終對(duì)結(jié)果進(jìn)行評(píng)估。質(zhì)疑不應(yīng)成為我們前進(jìn)的障礙。今天我們主要使用機(jī)器學(xué)習(xí)來(lái)查找數(shù)據(jù)中的特征,10年后,機(jī)器學(xué)習(xí)算法或許可以獨(dú)立地提出問(wèn)題,并在發(fā)現(xiàn)新物理學(xué)時(shí)識(shí)別它們。”