最近一項研究表明,人類可以使用少于1%的原始信息來分類數(shù)據(jù),驗證了一種解釋人類學習的算法——這種方法也能夠用于機器學習、數(shù)據(jù)分析和計算機視覺。
人類能夠快速地學會識別復雜的物品和它們的變體。通常我們總是能夠識別出字母「A」,不管其字體如何,紋理如何或者背景如何。我們也能夠認出同事的面孔,即使她帶了帽子或者換了發(fā)型。我們還能僅通過部分可見部位識別出某一物品,比如說床之一角或者門縫邊緣。但是我們是如何做到的呢?在這些不同的任務中,人類有沒有使用到一些簡單的技術呢?這些技術能否移植到計算機上來改進計算機視覺、機器學習或機器人性能呢?
喬治亞理工學院的研究員們發(fā)現(xiàn)人類能夠僅使用少于1%的原始信息對數(shù)據(jù)進行分類,驗證了一種解釋人類學習的算法——這種方法也能夠用于機器學習、數(shù)據(jù)分析和計算機視覺。
喬治亞理工學院的計算機科學特聘教授Santosh Vempala是該項目的4名研究員之一。他說:「人類是如何理解周遭如此龐大、種類繁多的數(shù)據(jù),而且還處理得如此迅速和可靠呢?在最根本的水平上,人們是如何開始做這樣的事情的呢?這是個計算方面的問題。」
喬治亞技術學院計算學院的研究員Rosa Arriaga、Maya Cakmak、David Rutter和Vempala研究了人類在「隨機映射」(random projection)測試中的表現(xiàn),以此來理解人們在學習物體的表現(xiàn)有多好。他們向測試對象展示一系列原始的抽象圖片,之后測試他們能否在隨機展示的、僅有圖片一部分區(qū)域的情況下正確識別出這些圖片。
高級研究科學家和發(fā)展心理學家Arriaga解釋道:「我們假設隨機映射是人類進行學習的一種方法。簡單來說,我們的預測是正確的。總數(shù)據(jù)的僅僅0.15%對人類來說就已經足夠了。」
接下來,研究員們測試了一種計算機算法,讓機器(非常簡單的神經網絡)完成同樣的測試。機器和人類表現(xiàn)的一樣好,這給了我們一種有關人類如何學習的新理解。Arriaga說道:「我們找到的證據(jù)表明,事實上,人類和神經網絡的表現(xiàn)非常相似。」
研究者想對典型和非典型刺激的樣子建立一個數(shù)學定義,以此來預測哪些數(shù)據(jù)對人類和機器來說是最難學的。由于人類和機器的表現(xiàn)差不多,證明了你能預測隨著時間推移,哪些數(shù)據(jù)是最難學習的。
他們的研究成果最近發(fā)表在麻省理工學院出版的期刊《神經計算》(Neural Computation)上。據(jù)悉,這是首個采用人類被試的「隨機映射」研究。
為了驗證他們的理論,研究者先創(chuàng)作了3組150×150像素的抽象圖像,然后創(chuàng)作了創(chuàng)作了這些圖像中非常小的局部的「隨機草圖」。測試對象被展示了完整的圖片,時間為10秒。接著,向他們隨機展示了每張圖片的16張草圖。使用抽象圖片的目的是為了防止人類和機器擁有任何先驗知識。
Vempala說:「我們驚奇于極其簡單的神經網絡和人類之間的表現(xiàn)是如此接近,神經網絡的設計靈感就是來自于我們所認為的人類學習方式,但僅是個非常微弱的靈感。發(fā)現(xiàn)它如此匹配人類的表現(xiàn)力實在是驚奇。」
加州大學圣地亞哥分校的計算機科學與工程學教授 Sanjoy Dasgupta說道:「這篇迷人的論文介紹了一種基于局部的隨即映射,能夠在將圖片進行壓縮的同時,仍然使得人類和機器能夠區(qū)分大類。這是來自于幾何、神經計算和機器學習中的創(chuàng)新性見解組合。」
雖然研究員們無法明確地宣布人類大腦確實采用了隨機映射,但作者總結到,這個結果支持了這樣一種觀念:隨機映射是一種可能的解釋。另外,這暗示著一種非常有用的機器學習的技術:大數(shù)據(jù)如今是一巨大挑戰(zhàn),而隨機映射是一種能使數(shù)據(jù)可控而不丟失核心內容的方法,至少對于一些基本任務(比如分類和決策制定)來說是這樣。
基于隨機映射的學習算法理論已被引用超過300余次,并成為了機器學習的一種常用技術,來處理不同類型的大量數(shù)據(jù)。