據(jù)外媒報(bào)道,伴隨著互聯(lián)網(wǎng)的不斷普及以及移動(dòng)設(shè)備的不斷流行,現(xiàn)在,數(shù)據(jù)及其設(shè)備中心要比過(guò)去任何一個(gè)時(shí)代都顯得重要。這種被叫做大數(shù)據(jù)分析的處理過(guò)程大部分情況下還是需要借助人類(lèi)的直覺(jué)來(lái)完成。任何一位人工智能(AI)科學(xué)家都認(rèn)為,直覺(jué)是人類(lèi)思維過(guò)程中最難復(fù)制的部分之一。然而就在近日,來(lái)自MIT的科研人員可能在這一領(lǐng)域取得了突破。
據(jù)悉,由他們開(kāi)發(fā)出的數(shù)據(jù)科學(xué)機(jī)器(Data Science Machine)能夠像人類(lèi)一樣執(zhí)行數(shù)據(jù)分析甚至更優(yōu)秀。
數(shù)據(jù)科學(xué)機(jī)器專(zhuān)門(mén)為大數(shù)據(jù)分析設(shè)計(jì)打造。為了測(cè)試這套系統(tǒng)的能力,科研人員讓其參加了3項(xiàng)數(shù)據(jù)科學(xué)競(jìng)賽。在其中一場(chǎng)競(jìng)賽中,參賽隊(duì)伍總數(shù)有906支,數(shù)據(jù)科學(xué)機(jī)器最終的表現(xiàn)排在第614名。在另外兩場(chǎng)競(jìng)賽中,這套AI分別與人類(lèi)并列第94名和第96名。雖然在第三場(chǎng)競(jìng)賽中它的正確率只有87%,但它花費(fèi)的時(shí)間卻遠(yuǎn)遠(yuǎn)少于人類(lèi)--其最多只用了12個(gè)小時(shí),而人類(lèi)卻用了好幾個(gè)月的時(shí)間。
Max Kanter是為打造數(shù)據(jù)科學(xué)機(jī)器提供基礎(chǔ)的論文的作者,他和他的論文導(dǎo)師Kalyan Veeramachaneni用了數(shù)套技術(shù)賦予系統(tǒng)類(lèi)似于直覺(jué)的能力。例如,他們?cè)跀?shù)據(jù)庫(kù)中使用了結(jié)構(gòu)關(guān)系作為提示。由于現(xiàn)在所有大型數(shù)據(jù)庫(kù)都存有關(guān)聯(lián),所以Kanter他們的部署工作也就容易了許多。
擔(dān)心這樣的技術(shù)會(huì)讓人類(lèi)遭遇機(jī)器人革命?至少目前看起來(lái)不會(huì),獲悉,數(shù)據(jù)科學(xué)機(jī)器目前只被運(yùn)用到極為平凡的任務(wù)中。特別是,這套機(jī)器被用于幫助MIT了解學(xué)生傾向于放棄的在線課程研究上。現(xiàn)在,這臺(tái)機(jī)器還開(kāi)始試圖通過(guò)分析學(xué)生簽到的時(shí)間及他們?cè)诰€的學(xué)習(xí)時(shí)間來(lái)了解更多。
Kantar表示,世上擁有太多太多的數(shù)據(jù)。但是,它們大部分都靜靜地呆在那里,沒(méi)有得到使用或未獲得充分使用。但數(shù)據(jù)科學(xué)機(jī)器將能幫助人們減少篩選實(shí)用數(shù)據(jù)的時(shí)間。