來自美國能源部斯坦福直線加速器中心(SLAC)和費米國家加速器實驗室的科學家,在8月2日發表于《自然》雜志的一篇文章中,總結了機器學習在粒子物理學領域的當前應用和未來前景。
該論文共同作者、美國威廉瑪麗學院的亞力山大·拉多維奇說:“機器學習算法自己知道如何進行各種分析,這有望為我們節省無數小時的設計和分析工作。”拉多維奇目前正參與費米實驗室的NuMI離軸中微子實驗(NOVA)。
機器學習篩查大數據
機器學習已被證明在分析領域非常成功。為了處理像在LHC內進行的那些現代實驗中產生的海量數據,研究人員應用所謂的“觸發器”——專用的硬件和軟件,它們能實時決定哪些數據可保存下來以供分析,哪些數據可以丟棄。
論文作者之一、麻省理工學院的邁克·威廉姆斯說,機器學習算法至少可由做出其中70%的決定。威廉姆斯目前正參與LHCb實驗,該實驗可幫助科學家揭示為何宇宙中物質的數量遠遠多于反物質的數量。
LHC中巨大的超環面儀器(ATLAS)與緊湊渺子線圈(CMS)能發現希格斯玻色子,每個探測器都有數百萬個傳感元件,其信號需要放在一起才能獲得有意義的結果。SLAC的邁克爾·卡根說道:“這些信號組成了一個復雜的數據空間,我們需要了解它們之間的關系,得出結論,例如,探測器中某個粒子的軌跡是由電子、光子還是其他東西產生。”
中微子實驗也受益于機器學習。NOVA研究了中微子在穿越地球時如何從一種類型轉變為另一種類型,這些中微子振蕩可能潛在地揭示一種新類型中微子的存在,一些理論認為,這種中微子是暗物質的粒子。NOVA的探測器正在監視中微子撞擊探測器材料時產生的帶電粒子,并且,機器學習算法可以識別它們。
識別特征 進行模擬
機器學習算法日益復雜和精細,為解決粒子物理問題開辟了前所未有的機會。機器學習的最新發展——所謂的深度學習,即使用神經網絡,改進了粒子物理學家們的實驗方式。
卡根說,他們可以使用深度學習的許多新任務都與計算機視覺有關,“它與面部識別相似,只是在粒子物理學中,圖像特征比耳朵和鼻子更抽象。”
像NOVA這類實驗產生的數據很容易轉化為實際圖像,AI可以很容易地從中識別特征。拉多維奇說:“即使數據看起來不像圖像,如果能夠以正確的方式處理數據,我們仍然可以使用計算機視覺方法。這種方法非常有用的一個領域是,對大型強子對撞機產生的大量粒子射流進行分析。”
深度學習的另一個新興應用是粒子物理學數據的模擬,如預測LHC中的粒子碰撞會發生什么,并與實際數據比較。傳統模擬通常很慢且需要巨大的計算能力,而AI可以更快地進行模擬。
卡根說:“雖然這是非常早期的工作,但它顯示出許多希望,并可能有助于應對未來的數據挑戰。”
質疑促進進步
盡管有明顯進步,但機器學習愛好者經常需要面對來自合作伙伴的質疑,部分原因是機器學習算法大多數時候就像“黑匣子”,很少能提供關于它們如何得出某個結論的信息。
威廉姆斯認為:“質疑是好事,如果你將機器學習用做丟棄數據的觸發器,就像我們在LHCb中所做的那樣,那么你需要非常謹慎并設置非常高的標準。因此,在粒子物理學領域建立機器學習需要不斷努力,以更好地理解算法的內部工作原理,并盡可能地與實際數據進行交叉檢查。”
論文共同作者、工作于MicroBooNE中微子實驗的SLAC研究員寺尾一寬(音譯)說:“在應用AI方面,我們應該不斷嘗試,并始終對結果進行評估。質疑不應成為我們前進的障礙。今天我們主要使用機器學習來查找數據中的特征,10年后,機器學習算法或許可以獨立地提出問題,并在發現新物理學時識別它們。”