據(jù)國外媒體報道,研究人員認(rèn)為,電腦不久便會在很多領(lǐng)域取代人類直覺。麻省理工學(xué)院研發(fā)了一項新系統(tǒng),而該系統(tǒng)在幾次競賽中表現(xiàn)得比最聰明的人還要出色。麻省理工學(xué)院的研究人員設(shè)計了一款大數(shù)據(jù)分析系統(tǒng)。該系統(tǒng)的目的是,在尋找數(shù)據(jù)背后隱藏的規(guī)律時,可以起到替代人類直覺的作用。
該系統(tǒng)名為“數(shù)據(jù)科學(xué)機”(Data Science Machine),和人類選手一起參加了三次數(shù)據(jù)科學(xué)競賽,并且在三次競賽中都獲得了出色的成績。在這三次競賽中,數(shù)據(jù)科學(xué)機的預(yù)測準(zhǔn)確率分別為最終獲勝者的94%、96%和87%,在共906支參賽隊伍中,這一成績超過了615支隊伍。
“我們將數(shù)據(jù)科學(xué)機視作對人類智慧的天然補充,”麥克斯·坎特(Max Kanter)說道。正是他的碩士論文為該機器提供了理論基礎(chǔ)。
“有太多太多的數(shù)據(jù)需要進行分析,但目前并沒有得到我們的充分利用。因此,我們或許應(yīng)當(dāng)找出某種解決方案,就算實際解決不了什么問題,至少也能讓我們行動起來。
數(shù)據(jù)科學(xué)機能夠以“非人”的速度完成其預(yù)測計算,每次提交答案所需時間僅為2小時到12小時之間,而人類參賽隊伍則需要工作數(shù)月時間,才能完成相應(yīng)的計算。卡爾安·維拉馬沙納尼(Kalyan Veeramachaneni)是坎特的論文導(dǎo)師及麻省理工學(xué)院計算機科學(xué)與人工智能實驗室的一名研究科學(xué)家,他和坎特共同參與了這項研究。
在選擇具有某種特征的數(shù)據(jù)進行分析時,往往要用到人類的直覺。而這兩名研究人員的研究結(jié)果便是,讓機器來做這個決定,即扮演起人類直覺的角色。“在為工業(yè)解決了大量數(shù)據(jù)科學(xué)問題之后,我們從自身經(jīng)驗中觀察發(fā)現(xiàn),這其中有著至關(guān)重要的一步,叫做特征工程。”
數(shù)據(jù)科學(xué)機運用多種指標(biāo),尋找數(shù)據(jù)庫中、數(shù)據(jù)結(jié)構(gòu)關(guān)系間的相關(guān)性,該機器可以利用這些指標(biāo)在數(shù)據(jù)庫中進行部署工作,并找到這些數(shù)字的平均數(shù)。在這一過程中,該機器還會尋找分類數(shù)據(jù),即處在某一范圍之內(nèi)的數(shù)據(jù),例如一周之中的某幾天等。
通過與麻省理工學(xué)院計算機科學(xué)與人工智能實驗室(CSAIL)的其他研究人員的合作,維拉馬沙納尼成功地將機器學(xué)習(xí)技術(shù)運用于解決實際問題之中,例如,預(yù)測有哪些學(xué)生會翹掉在線課程。
他表示,制造數(shù)據(jù)特征是該過程中極其重要的一步。“首先你得確定需要從數(shù)據(jù)庫中提取出哪些變量,而為此你可能會有許多不同的想法。”
“數(shù)據(jù)科學(xué)機本身就是一項令人難以置信的偉大項目,因為它成功地將尖端研究成功運用到解決實際問題中去,提供了一種全新的看待該問題的方式。”哈佛大學(xué)的一名計算機科學(xué)教授馬戈·塞爾策(Margo Seltzer)說道。“我認(rèn)為,他們所做的一切很快就會變成行業(yè)標(biāo)準(zhǔn)。”