從基因圖譜到太空探索,人類不斷產生著越來越大的數據集——遠超過了人類可以處理、管理和理解的范疇。
機器學習系統能夠幫助研究者處理這些日漸增長的信息洪流。一些最強大的分析工具是建立在一種奇特的幾何學分支上的,稱為拓撲學。拓撲學研究的是那些即使在彎曲或拉伸的狀態下依然保持不變的性質。
這樣的拓撲系統在分析復雜網絡中的聯系時,特別有用,例如大腦內部、美國電力網絡或國際互聯網中的連接。但是,即使用現代最強大的超級計算機,這種問題還是令人生畏,很難解決?,F在,MIT、滑鐵盧大學和南加州大學共同開發出一種新的方法,將使用量子計算機來解決上述問題。
這個團隊在本周的《Nature Communications》雜志上提出了他們的理論。 該論文的第一作者Seth Lloyd教授解釋說,這種新方法的關鍵在于代數拓撲。每次人們在收集真實世界的數據時,都會出現一些不可避免的扭曲,而這種方法可以幫助減輕這種扭曲帶來的影響。
在拓撲描述中,數據最基本的特征(它有多少個洞?不同的部分之間如何相連?)將被看做是一樣的,無論它們如何拉扯、壓縮或扭曲。Lloyd解釋說,在試著重構數據應當表征的真實世界的隱藏模式時,這些基本的拓撲屬性通常非常重要。
這與分析數據的類別無關,他說。在尋找聯系和孔洞時,無論是真實的物理孔洞,還是數據中顯示出來的邏輯漏洞,拓撲學方法都能發揮作用。這些漏洞它都能找出來。
采用傳統計算機時,這個方法的要求實在太高了,除了最簡單的情況以外。拓撲學分析「表現了一種找出數據重要特征的關鍵方法,但是它在計算上卻很昂貴。這就是可以采用量子機制的地方,」Lloyd說。這種基于量子的新方法,將以指數級加快計算速度。
Lloyd舉出了一個例子,來說明潛在的加速:如果你有一個數據集,其中包含著300個點,要分析這個系統的拓撲特征,傳統的方法需要「一臺宇宙那么大的計算機」。也就是說,它需要2^300個運算器,近似等于宇宙中所有粒子的數量。所以,用這種方法根本行不通。
「這就是我們的算法發揮作用之處,」他說。用一臺量子計算機的新系統來解決這個問題,只需要300個量子比特——而Lloyd認為這樣的機器在接下來的幾年內就有可能變成現實。
他說:「我們的算法展示出,你并不需要一臺巨大的量子計算機,就能解決這種嚴峻的拓撲學問題?!?/p>
Lloyd說,量子拓撲的方法還可以用在許多重要的巨大數據集中,例如理解大腦中的連接?!笇⑼負浞治鲇迷谀X電圖或功能核磁共振的數據集中,你就能揭示出,我們的思維過程之下,放電神經元的復雜連接和拓撲序列?!?/p>
同樣的方法還可以用在分析其他很多類型的信息?!改憧梢詫⑵溆迷谑澜缃洕?,或者社交網絡上,還有遠程貨物運輸或信息交換的系統上。」而傳統的計算機的限制讓它們無法解決這些問題。
目前,這個方法還只停留在理論階段。Lloyd說,實驗家們已經開始聯系他們,想嘗試一下原型機?!冈谝慌_非常簡單的量子計算機上,你就能找出簡單結構的拓撲結構。人們正在嘗試這方面的概念驗證實驗?!?/p>