精品国产一级在线观看,国产成人综合久久精品亚洲,免费一级欧美大片在线观看

當前位置:統(tǒng)一通信/協(xié)作企業(yè)動態(tài) → 正文

Facebook如何使用“我們”的數(shù)據(jù)去構(gòu)建人工智能

責(zé)任編輯:jacky 作者:機器之心 |來源:企業(yè)網(wǎng)D1Net  2015-10-03 08:27:14 本文摘自:虎嗅網(wǎng)

Facebook如何使用“我們”的數(shù)據(jù)去構(gòu)建人工智能

本文來自Popsci.com,由機器之心編譯:

是時候停止把Facebook當作純粹的社交媒體公司來看了。它用無人機提供互聯(lián)網(wǎng)服務(wù),為了發(fā)展虛擬現(xiàn)實而收購Oculus,不懈追求人工智能,F(xiàn)acebook已經(jīng)迅速成為世界上最先進的技術(shù)研究中心之一了。

無獨有偶,谷歌甚至IBM之類的公司也有類似的計劃,總的來說,人工智能領(lǐng)域的發(fā)展已經(jīng)提速到無疑會影響到人機交互的節(jié)點了。事實上,這已經(jīng)發(fā)生了,不過是悄悄地在幕后進行。每月為15億用戶提供服務(wù)的Facebook對人工智能技術(shù)興趣濃厚。Facebook解決的是模擬一般智力的問題——即讓計算機日漸脫離線性邏輯的機器的思考方式,而是像我們自由形態(tài)的人類以多管齊下的方式來思考。Facebook人工智能研究室(FAIR)致力于解決廣義的人工智能的問題,而語言技術(shù)項目組和Facebook M(虛擬助手)這類規(guī)模稍小的項目組則致力于開發(fā)用戶操作中會用到的實際功能。

Facebook人工智能研究室的誕生

一切始于2013年,F(xiàn)acebook創(chuàng)始人兼CEO Mark Zuckerberg、CTO Mike Schroepfer和其他公司高層在評估公司上線十年以來的成就,并思考在接下來的十年、二十年如何長盛不衰。

Facebook已經(jīng)將機器學(xué)習(xí)運用到其流行的社交網(wǎng)絡(luò)中,比如說決定用戶會在News Feeds中看到什么內(nèi)容。不過相比起當時前沿的神經(jīng)網(wǎng)絡(luò)成果,這不過是小兒科。

一些Facebook工程師也一直在嘗試積卷神經(jīng)網(wǎng)絡(luò)(CNNs),這是一種非常強大的機器學(xué)習(xí),現(xiàn)在普遍被用于圖像識別。 即便人工智能還處于發(fā)展初期,Zuckerberg對它的潛力非常看好,因此他從谷歌大腦(Google Brain)挖了一位叫做Marc Aurelio Ranzato的工程師。然后他追本溯源找到了積卷神經(jīng)網(wǎng)絡(luò)的發(fā)明者——Yann LeCun。

Facebook人工智能實驗室負責(zé)人Yann LeCun是人工智能界的一個傳奇。他最早在1988年在貝爾實驗室擔任研究員(由電話之父Alexander Graham Bell創(chuàng)立,并因其在電信技術(shù)領(lǐng)域的無數(shù)領(lǐng)域的實驗而聞名)開始他的研究,然后在AT&T實驗室擔任部門主管直到2003年。那之后他開始在紐約大學(xué)任教。現(xiàn)代的卷積神經(jīng)網(wǎng)絡(luò)是 LeCun職業(yè)生涯的巔峰之作。你是否曾經(jīng)好奇過ATM怎么能識別你的支票?這就得益于 LeCun負責(zé)的「SN」的神經(jīng)網(wǎng)路模擬器的早期研究,于1996年被采用。

「我開始和Schroepfer 和Mark接洽,我想他們也許喜歡我向他們講述的東西」,LeCun在接受《Popular Science》采訪中說道:「他們試圖說服我來運作這個實驗室……當像Mark 那樣的人跑過來和你說:『好吧,你基本上接受了全權(quán)委托。你能組建世界一流的研究室,我希望你建立起全世界最好的人工智能研究實驗室』。我的回答將會是:『嗯,相當有意思的挑戰(zhàn)。』」

關(guān)于世界頂級的研究室是什么樣子,Yann有自己的想法。如果你想要吸引頂尖人才,你得有一個雄心勃勃的研究室,有著雄心勃勃的長期目標。然后你還得給他們工作上的自由權(quán),同時對你的研究你必須持有非常開放的態(tài)度。「這和Facebook的信念有幾分吻合,F(xiàn)acebook秉持著開放的理念。」LeCun說。

組建團隊

這個肩負著Facebook的未來的團隊規(guī)模很小,由大約 30個研究科學(xué)家和15名工程師組成。團隊有三個分支:Facebook人工智能研究組的主要辦公室位于紐約市的Astor Place,由LeCun管理著一個由20名工程師和研究人員組成的團隊。Menlo Park的是一個同等規(guī)模的分支。六月,F(xiàn)AIR又在巴黎設(shè)立了一個更小的5人組,與INRIA(法國計算機科學(xué)與自動化研究機構(gòu))合作。還有很多在Facebook其他部門一起合作致力于人工智能發(fā)展的團隊,例如語言技術(shù)團隊;FAIR只是主要的研究部門。

這些研究人員和工程師來自科技領(lǐng)域的各個層面,同時當中很多人都曾與Lecun合作過。高等級的人工智能研究并非是一個龐大的領(lǐng)域,而且Lecun的很多學(xué)生都創(chuàng)建了人工智能方面的初創(chuàng)公司,它們一般會被像Twitter這樣更大的企業(yè)收購。

Lecun曾經(jīng)告訴《連線》雜志,「深度學(xué)習(xí)實際上是Geofff Hinton,我,還有蒙特利爾大學(xué)的Yoshua Bengio之間的一個陰謀。」 Hinton在谷歌研發(fā)人工智能, Bengio奔波于蒙特利爾大學(xué)和數(shù)據(jù)挖掘公司Apstat之間,而LeCun也與其他行業(yè)內(nèi)的著名企業(yè)有千絲萬縷的關(guān)聯(lián)。

「當我第一次在貝爾實驗室做到部門主管時,我的老板對我說,你需要記住兩點:首先,永遠不要讓自己陷入團隊內(nèi)部的競爭。第二,只雇傭那些比你更聰明的人,」LeCun說。

負責(zé)領(lǐng)導(dǎo)語言研究子群的Leon Bottou,是LeCun的一個老同事。他們一同研發(fā)了神經(jīng)網(wǎng)絡(luò)模擬器,1987年的AmigaOS就是他們的第一個作品。Bottou 2015年3月加入的FAIR,此前他在為微軟研究組工作的同時,還致力于機器學(xué)習(xí)和機器推理的探索。

從左數(shù)起,Leon Bottou, Yann LeCun, 還有Rob Fergus,在Facebook的紐約辦公室里工作

2014年11月,LeCun請來 Vladimir Vapnik作為他們的團隊顧問。Vapnik和LeCun曾一起在貝爾實驗室工作,發(fā)表了關(guān)于機器學(xué)習(xí)的形成性研究,其中包括一項測量機器學(xué)習(xí)能力的技術(shù)。Vapnik是統(tǒng)計學(xué)習(xí)理論之父,統(tǒng)計學(xué)習(xí)理論即基于既定數(shù)據(jù)的預(yù)測。預(yù)測,對人類來說似乎是一個簡單的任務(wù),實際上卻需要關(guān)于預(yù)先形成的概念和對世界的觀察的海量信息(更多是后者)。Vapnik,這一領(lǐng)域的先驅(qū),基于他在知識傳播上的興趣,繼續(xù)著這一領(lǐng)域的工作,并把師生互動時的線索運用在機器學(xué)習(xí)當中。

目標

團隊的規(guī)模和科研力量允許Facebook擁有雄心勃勃的長期目標,絕不會達不到被LeCun稱為「明確的智慧」的標準。

「迄今,最好的人工智能系統(tǒng)也是愚鈍的,因為它們沒有常識。」LeCun說道。他用一種情況舉例,比如我拿起一個瓶子,然后離開房間。(我們在紐約Facebook的會議室里討論真正的機器智能的誕生,而這個房間的名字卻不怎么吉利—— Gozer the Gozerian,與《捉鬼敢死隊》里面的反派同名。)人類的大腦不難想象出一個人拿起瓶子然后離開房間這么個簡單的場景,但對一臺機器來說,僅這個前提就會導(dǎo)致大量的信息缺失。

Yann一邊說,我一邊在心中想象這個場景:「你很可能站起來,即使我在語句中沒有提到,你也很可能走動;你打開門,走進去,也許還會關(guān)上門;瓶子不在房間里。由于知道真實世界的情況和界限,你可以借由判斷。因此我并不需要告訴你所有的細節(jié)。」

現(xiàn)在對于機器如何學(xué)習(xí)該水平的推理,人工智能領(lǐng)域的專家知道得并不多。在向這個目標邁進途中,F(xiàn)acebook正致力于制造能足夠好地學(xué)習(xí)已知世界的機器。

LeCun說:「最大的障礙是自助式學(xué)習(xí)(unsupervised learning)。」現(xiàn)在機器主要通過一兩種方式進行學(xué)習(xí),即他助式學(xué)習(xí)(supervised learning)——在系統(tǒng)中,向機器展示成千上萬的狗的圖片,直到機器了解了狗的特征。谷歌的DeepDream以研究者反轉(zhuǎn)流程以揭示出其有效性對這一方法進行了闡釋。

另一種方式是增強學(xué)習(xí)(reinforcement learning),即機器對給出的信息以是或否的二擇一的方式進行選擇,以給出一個答案。這種學(xué)習(xí)耗費的時間稍長,但是機器被強制由自身做出內(nèi)在的抉擇。當這兩種學(xué)習(xí)方式結(jié)合起來時,就會產(chǎn)生強大結(jié)果。(還記得DeepMind Atari嗎)。自助式學(xué)習(xí)不需要反饋或者輸入,LeCun表示這就是人類的學(xué)習(xí)方式。我們發(fā)現(xiàn)、得出結(jié)論,并將其加入到人類的知識庫存之中。這,被證明是一項艱巨的任務(wù)。

LeCun笑著說:「我們甚至沒有一個用以發(fā)展人工智能的基本指導(dǎo)原則,很明顯,我們在努力尋找。我們有很多點子,只是目前沒一個奏效罷了。」

真正人工智能的早期探索

但是這并不是說以前的探索沒有成果。現(xiàn)在讓LeCun激動的是關(guān)于」記憶網(wǎng)絡(luò)」的工作,其可以被整合進積卷神經(jīng)網(wǎng)絡(luò),并使它們獲得記憶保持的能力。LeCun把這個新的記憶模型比作大腦中的分別由海馬體和大腦皮層控制的短期記憶和長期記憶(LeCun厭惡把CNNs比作大腦,相反他更喜歡這個模型:一個帶有50億把手的黑箱)。

記憶單元允許研究者向該「記憶網(wǎng)絡(luò)」講說一個故事,隨后使該網(wǎng)絡(luò)回答關(guān)于這個故事的問題。

故事選自《指環(huán)王》一書。我們不把全書而是書中主要情節(jié)的簡短概述(「比爾博拿到了魔戒」)講給「記憶網(wǎng)絡(luò)」,當被問及在書中某一具體情節(jié)中魔戒在哪里,這個「記憶網(wǎng)絡(luò)」能做出簡短正確的回答。Facebook 熟悉科學(xué)官Mike Schroepfer說(他強調(diào)技術(shù)可以幫助Facebook以更高的精確度向人們展示其想看到的)這意味著它理解書中事物與時間的關(guān)系。

「通過搭建能理解世界的本質(zhì)、了解你所想要的是什么的系統(tǒng),我們就能幫助你。」 Schroepfer在三月的一個開發(fā)者報告會上說道:「我們能搭建出一個系統(tǒng),確保讓所有人可以把時間花在他們真正關(guān)心的事情上。」

FAIR團隊正在圍繞這個目標開發(fā)一個被稱為「嵌入世界」的項目。在該項目中,為了幫助機器更好的理解現(xiàn)實,F(xiàn)AIR團隊正在教它們用向量表示所有事物之間的關(guān)系,如:圖像,帖子,評論,相片及視頻等之間的關(guān)系。神經(jīng)網(wǎng)絡(luò)也在構(gòu)建一個包含了能組合媒體內(nèi)容、不同個體之間的距離等錯綜復(fù)雜內(nèi)容的體系。

嵌入世界

Lecun說通過使用這一系統(tǒng)能讓我們開始「用代數(shù)替換原因」。這表示著讓人難以置信的強大。在嵌入世界項目中開發(fā)的人工神經(jīng)網(wǎng)絡(luò)能夠根據(jù)視覺相似性將在同一地點拍攝的兩張不同照片連接起來,并能指出文字描述是否符合場景。它重建了現(xiàn)實的一種虛擬記憶,并將之在其他地方和事件的背景下進行聚類。它甚至能根據(jù)一個人之前的喜好,興趣以及數(shù)字經(jīng)歷「虛擬地表示這個人」。雖然這還只是帶有實驗性質(zhì)的,但是對Facebook 的新聞流呈現(xiàn)具有很大的影響,在跟蹤標簽上也進行了一定的使用。

有很多關(guān)于長期目標的演說,但恰恰是小的勝利讓Facebook不斷前行。在2014年6月,他們發(fā)表了一篇名為《DeepFace:縮小人類表現(xiàn)與人臉識別間差距》的文章,該文宣稱在Facebook的這項技術(shù)在人臉識別中已達到97%的準確率。Lecun說:他相信Facebook的人臉識別技術(shù)已達到世界第一,這也是Facebook與學(xué)術(shù)研究機構(gòu)的一個關(guān)鍵性的區(qū)別。現(xiàn)在,DeepFace是Facebook自動標記照片背后的驅(qū)動力。

「如果我們有一個切實有效的想法,我們就能讓它在一個月內(nèi)出現(xiàn)在15億人面前。」LeCun說,「讓我們把目光聚焦在我們的長期目標的高度上,但是,在這個過程中會有很多我們將要去實現(xiàn)的會在短期具有實用性質(zhì)的事。」

facebookai2.jpg

作為FAIR的研究成員之一的Rob Fergus(右站立),正在紐約辦公室處理有關(guān)人工智能虛擬方面的工作

作為在NYU和MIT計算機科學(xué)和人工智能實驗室工作過的老手,Rob Fergus領(lǐng)導(dǎo)著有關(guān)計算機視覺的AI團隊。他們的工作已經(jīng)在自動標記相片上得到使用,接下來將被用于標記視頻。大量視頻因為缺乏元數(shù)據(jù),或者沒有任何描述性文本,而被「淹沒」于噪聲中。AI將會能夠「觀看」視頻,并將它們大致分類。

這對Facebook阻止那些不想被上傳到他們服務(wù)器上的內(nèi)容具有巨大的意義—例如色情照片,版權(quán)問題或者其他違反他們使用條款的任何內(nèi)容。它也能鑒別新聞事件,對不同類型的視頻進行管理。Facebook此前一直將這些任務(wù)劃分給外包公司,當這項技術(shù)穩(wěn)定后,F(xiàn)acebook就能降低這部分的人工成本。

在目前的測試中,人工智能表現(xiàn)得很有希望。給它播放一段正在進行的體育視頻,比如冰球、籃球或乒乓球,人工智能能夠準確地識別出這個體育項目。并且還可以區(qū)分壘球和棒球,漂流和皮劃艇,以及籃球和街球這些類似的運動。

Facebook背后的人工智能

Facebook有一個叫做語言科技的獨立小組,主要負責(zé)開發(fā)翻譯,語言辨識和自然語言理解。LeCun所在的部門,F(xiàn)acebook人工智能研究室(FAIR)是Facebook人工智能戰(zhàn)略研究的主力,而語言科技(從屬于應(yīng)用機器學(xué)習(xí))是實際進行軟件開發(fā)的地方。

他們與FAIR合作,但獨立進行開發(fā)和實踐,并且已經(jīng)開發(fā)了493種廣泛使用的翻譯方向(從英語到法語,從法語到英語算兩種方向)。

本著讓世界更開放更連通的宗旨,語言服務(wù)是Facebook的一條必經(jīng)之路。超過一半以上的Facebook用戶不說英語,然而Facebook上大部分的內(nèi)容都是通過英語呈現(xiàn)的,語言科技小組的負責(zé)人Alan Packer說道。

約有三億三千萬用戶經(jīng)常點擊「見翻譯」按鈕使用這些翻譯服務(wù)。

如果你是第一個點擊翻譯按鈕的人,恭喜,你已經(jīng)操作了人工智能了。首次點擊會向服務(wù)器發(fā)出翻譯請求,之后該請求將存儲起來供其他用戶使用。Packer說,夏奇拉(Shakira,著名拉丁裔歌手)發(fā)布的內(nèi)容總是很快就翻譯出來了。語言科技小組還推出了本地內(nèi)容翻譯,通過點擊「見原文」按鈕可以體驗這項服務(wù)。

人工智能是這項任務(wù)里一個必要的環(huán)節(jié),因為「傻瓜」翻譯對于人們彼此之間相互溝通作用不大,還會生成不正確的語法,誤讀的習(xí)語,俚語也無從參考。這就是過去Google翻譯那種直接逐詞翻譯的缺陷。

Packer說,修辭尤其難翻譯,但人工智能可以把握一些語義層面的含義。

「如果把『熱狗(hot dog)』這個詞組按字面翻譯成法語,是說不通的。『Chaud chien』對法國人來說沒有任何意義,」Packer說道。「同樣如果你拿著一幅我滑雪的照片,我說,『我今天秀了一下滑雪技巧(I’m hot dogging it today),』這就變得很難理解,因為這里的hot dogging是炫耀的意思。」

盡管這種理解并不算太多,但早期的結(jié)果預(yù)示著這個任務(wù)很難處理。Packer說,人工智能的妙處在于它不會去理解比喻或習(xí)語,但仍會在不理解的同時認識到這一點。

人工智能本身具有適應(yīng)性,經(jīng)過訓(xùn)練后便可以很快掌握俚語。語言科技小組最近發(fā)現(xiàn)法國球迷在用一個新俚語表達「wow」,人工智能在接受那部分公用數(shù)據(jù)的神經(jīng)網(wǎng)絡(luò)訓(xùn)練以后,現(xiàn)在能夠可靠地將文本翻譯出來。他們通過每天對人工智能進行新數(shù)據(jù)的訓(xùn)練擴展Facebook的詞庫,不過所有語言的詞庫正在按月更新。

Facebook M

我們已經(jīng)習(xí)慣于個人數(shù)字助理,比如Siri,Cortana,以及Google Now。但Facebook選擇了一條不同的道路,其名為「M」的新型個人AI助理擁有超越手機界限處理復(fù)雜事物的能力。Siri可以發(fā)短信,而M可以預(yù)定航班或制定旅行計劃。在開發(fā)過程中,一位Facebook的雇員甚至讓M安排了一個找搬家公司到家中進行評估的日程。(不過當然了,你不能讓M給你買煙草、酒、槍支,或者給你安排色情服務(wù)。)

在三年內(nèi),M有可能能夠給有線電視公司或者車輛管理部門打電話,并幫用戶在線等待,直到對方的接線員接過電話。

事實上,F(xiàn)acebook M的主干來自于今年早些時候收購的一家創(chuàng)業(yè)公司:Wit.ia。他們加入了Messenger的小組,受VP David Marcus的管理,并在本月早些時候首次發(fā)布了M。

Alex LeBrun在Facebook內(nèi)部領(lǐng)導(dǎo)Wit.ai小組,他說人工智能不僅幫助M更好地完成一般的任務(wù),也能完成有一些特殊情況的任務(wù),如帶一個小嬰兒旅游,或在燈火管制日的時候旅行。這也意味著M的能力隨著人工智能的發(fā)展而發(fā)展。他樂觀地認為,在三年內(nèi),M就可能有能力呼叫有線電視公司或者車輛管理部門,并幫助用戶在線等待,直到有人接過電話。

「M這樣的服務(wù)最大的附加值在于它能夠完全滿足你的需求,甚至在你的需求比較特殊或比較奇怪的情況下,」 LeBrun 說,「在任務(wù)比較復(fù)雜或并非常理情況的時候,它也能完成任務(wù)。」

隨著M的運行,它能夠不斷學(xué)習(xí)。現(xiàn)在,它還沒有能力獨自運行。一個被稱為「AI訓(xùn)練者」的小組跟M一起工作,如果出現(xiàn)M不懂的任務(wù),小組會接管過來。隨后M可以從人類訓(xùn)練者身上學(xué)到應(yīng)該怎么做,并應(yīng)用到之后的任務(wù)中。在程序中還內(nèi)嵌了一種隨機機制,Lebrun說是為了讓它更像人類學(xué)習(xí)的過程。

「AI訓(xùn)練者」是個新的職位,F(xiàn)acebook本身也在對這個職位的探索中。他們說,這并不是一個給研究員或者工程師的職位,而是為那些擁有客戶服務(wù)經(jīng)驗的人準備的。Facebook將能夠評估哪些任務(wù)需要人類的干預(yù),但最后,他們希望在未來完成這些任務(wù)將不需要任何人類干預(yù)。

但在開發(fā)過程中,這個職位是必須的,因為他們的工作主要有兩部分:一是保證服務(wù)質(zhì)量的最后一道關(guān)卡,二是訓(xùn)練AI。

有人類智能做看門人,M可以在FAIR進行開發(fā)時當做沙盒來用。「如果有什么東西需要測試,就會在M中顯現(xiàn),因為在我們的訓(xùn)練和督導(dǎo)下,這個過程是沒有風(fēng)險的。」Lebrun說。

M平臺是完全建立在Wit.ai的平臺之上的(主要在Facebook收購前就已研發(fā)),但FAIR也會對用戶和個人AI助理的交互過程產(chǎn)生的數(shù)據(jù)用作深度學(xué)習(xí)。

Facebook在人工智能團體中的角色

「我們的研究項目都是完全公開的。幾乎我們做的每件事都會發(fā)布,大部分的代碼也都是開源的」 LeCun 說道。你可以在 Facebook 的研究網(wǎng)站上和 ArXiv——一個收納電腦科學(xué)、數(shù)學(xué)及物理研究的圖書館,找到這些出版物。

大多人工智能團體都是這樣不隱秘的。 LeCun 已成為發(fā)展 Torch(一個針對AI 發(fā)展的C++算法庫)的領(lǐng)軍人物。LeCun帶領(lǐng)他的團隊,還有 Twitter 和 Google的 DeepMind 的研究人員合作,共同發(fā)展 Torch。許多現(xiàn)今在這個領(lǐng)域的專家都曾是LeCun的學(xué)生。

任何他們可能出版的資料,從與醫(yī)學(xué)成像相關(guān)的資料到無人駕駛車,也都是公開以促進未來發(fā)展的,LeCun說道。Facebook的研究固然對他們的用戶很重要,但它的核心價值更佳體現(xiàn)在讓人類對如何更好地用機器來模仿智能的知識。

這是為什么Facebook是人工智能社區(qū)中重要的一部分,也是為什么這個社區(qū)本身是如此重要。

「那些你在好萊塢電影里看到的情節(jié),譬如一個在阿拉斯加與世隔絕的人研究出了完美運作,并在當下無人企及的人工智能系統(tǒng),是完全不可能的」。LeCun說,「這是當代最大最復(fù)雜的科學(xué)挑戰(zhàn)之一,沒有任何一個人,甚至一個大公司能夠憑他們自己解決。解決它需要整個研究發(fā)展社區(qū)的集體力量」。

關(guān)鍵字:FacebookLeCun

本文摘自:虎嗅網(wǎng)

x Facebook如何使用“我們”的數(shù)據(jù)去構(gòu)建人工智能 掃一掃
分享本文到朋友圈
當前位置:統(tǒng)一通信/協(xié)作企業(yè)動態(tài) → 正文

Facebook如何使用“我們”的數(shù)據(jù)去構(gòu)建人工智能

責(zé)任編輯:jacky 作者:機器之心 |來源:企業(yè)網(wǎng)D1Net  2015-10-03 08:27:14 本文摘自:虎嗅網(wǎng)

Facebook如何使用“我們”的數(shù)據(jù)去構(gòu)建人工智能

本文來自Popsci.com,由機器之心編譯:

是時候停止把Facebook當作純粹的社交媒體公司來看了。它用無人機提供互聯(lián)網(wǎng)服務(wù),為了發(fā)展虛擬現(xiàn)實而收購Oculus,不懈追求人工智能,F(xiàn)acebook已經(jīng)迅速成為世界上最先進的技術(shù)研究中心之一了。

無獨有偶,谷歌甚至IBM之類的公司也有類似的計劃,總的來說,人工智能領(lǐng)域的發(fā)展已經(jīng)提速到無疑會影響到人機交互的節(jié)點了。事實上,這已經(jīng)發(fā)生了,不過是悄悄地在幕后進行。每月為15億用戶提供服務(wù)的Facebook對人工智能技術(shù)興趣濃厚。Facebook解決的是模擬一般智力的問題——即讓計算機日漸脫離線性邏輯的機器的思考方式,而是像我們自由形態(tài)的人類以多管齊下的方式來思考。Facebook人工智能研究室(FAIR)致力于解決廣義的人工智能的問題,而語言技術(shù)項目組和Facebook M(虛擬助手)這類規(guī)模稍小的項目組則致力于開發(fā)用戶操作中會用到的實際功能。

Facebook人工智能研究室的誕生

一切始于2013年,F(xiàn)acebook創(chuàng)始人兼CEO Mark Zuckerberg、CTO Mike Schroepfer和其他公司高層在評估公司上線十年以來的成就,并思考在接下來的十年、二十年如何長盛不衰。

Facebook已經(jīng)將機器學(xué)習(xí)運用到其流行的社交網(wǎng)絡(luò)中,比如說決定用戶會在News Feeds中看到什么內(nèi)容。不過相比起當時前沿的神經(jīng)網(wǎng)絡(luò)成果,這不過是小兒科。

一些Facebook工程師也一直在嘗試積卷神經(jīng)網(wǎng)絡(luò)(CNNs),這是一種非常強大的機器學(xué)習(xí),現(xiàn)在普遍被用于圖像識別。 即便人工智能還處于發(fā)展初期,Zuckerberg對它的潛力非常看好,因此他從谷歌大腦(Google Brain)挖了一位叫做Marc Aurelio Ranzato的工程師。然后他追本溯源找到了積卷神經(jīng)網(wǎng)絡(luò)的發(fā)明者——Yann LeCun。

Facebook人工智能實驗室負責(zé)人Yann LeCun是人工智能界的一個傳奇。他最早在1988年在貝爾實驗室擔任研究員(由電話之父Alexander Graham Bell創(chuàng)立,并因其在電信技術(shù)領(lǐng)域的無數(shù)領(lǐng)域的實驗而聞名)開始他的研究,然后在AT&T實驗室擔任部門主管直到2003年。那之后他開始在紐約大學(xué)任教。現(xiàn)代的卷積神經(jīng)網(wǎng)絡(luò)是 LeCun職業(yè)生涯的巔峰之作。你是否曾經(jīng)好奇過ATM怎么能識別你的支票?這就得益于 LeCun負責(zé)的「SN」的神經(jīng)網(wǎng)路模擬器的早期研究,于1996年被采用。

「我開始和Schroepfer 和Mark接洽,我想他們也許喜歡我向他們講述的東西」,LeCun在接受《Popular Science》采訪中說道:「他們試圖說服我來運作這個實驗室……當像Mark 那樣的人跑過來和你說:『好吧,你基本上接受了全權(quán)委托。你能組建世界一流的研究室,我希望你建立起全世界最好的人工智能研究實驗室』。我的回答將會是:『嗯,相當有意思的挑戰(zhàn)。』」

關(guān)于世界頂級的研究室是什么樣子,Yann有自己的想法。如果你想要吸引頂尖人才,你得有一個雄心勃勃的研究室,有著雄心勃勃的長期目標。然后你還得給他們工作上的自由權(quán),同時對你的研究你必須持有非常開放的態(tài)度。「這和Facebook的信念有幾分吻合,F(xiàn)acebook秉持著開放的理念。」LeCun說。

組建團隊

這個肩負著Facebook的未來的團隊規(guī)模很小,由大約 30個研究科學(xué)家和15名工程師組成。團隊有三個分支:Facebook人工智能研究組的主要辦公室位于紐約市的Astor Place,由LeCun管理著一個由20名工程師和研究人員組成的團隊。Menlo Park的是一個同等規(guī)模的分支。六月,F(xiàn)AIR又在巴黎設(shè)立了一個更小的5人組,與INRIA(法國計算機科學(xué)與自動化研究機構(gòu))合作。還有很多在Facebook其他部門一起合作致力于人工智能發(fā)展的團隊,例如語言技術(shù)團隊;FAIR只是主要的研究部門。

這些研究人員和工程師來自科技領(lǐng)域的各個層面,同時當中很多人都曾與Lecun合作過。高等級的人工智能研究并非是一個龐大的領(lǐng)域,而且Lecun的很多學(xué)生都創(chuàng)建了人工智能方面的初創(chuàng)公司,它們一般會被像Twitter這樣更大的企業(yè)收購。

Lecun曾經(jīng)告訴《連線》雜志,「深度學(xué)習(xí)實際上是Geofff Hinton,我,還有蒙特利爾大學(xué)的Yoshua Bengio之間的一個陰謀。」 Hinton在谷歌研發(fā)人工智能, Bengio奔波于蒙特利爾大學(xué)和數(shù)據(jù)挖掘公司Apstat之間,而LeCun也與其他行業(yè)內(nèi)的著名企業(yè)有千絲萬縷的關(guān)聯(lián)。

「當我第一次在貝爾實驗室做到部門主管時,我的老板對我說,你需要記住兩點:首先,永遠不要讓自己陷入團隊內(nèi)部的競爭。第二,只雇傭那些比你更聰明的人,」LeCun說。

負責(zé)領(lǐng)導(dǎo)語言研究子群的Leon Bottou,是LeCun的一個老同事。他們一同研發(fā)了神經(jīng)網(wǎng)絡(luò)模擬器,1987年的AmigaOS就是他們的第一個作品。Bottou 2015年3月加入的FAIR,此前他在為微軟研究組工作的同時,還致力于機器學(xué)習(xí)和機器推理的探索。

從左數(shù)起,Leon Bottou, Yann LeCun, 還有Rob Fergus,在Facebook的紐約辦公室里工作

2014年11月,LeCun請來 Vladimir Vapnik作為他們的團隊顧問。Vapnik和LeCun曾一起在貝爾實驗室工作,發(fā)表了關(guān)于機器學(xué)習(xí)的形成性研究,其中包括一項測量機器學(xué)習(xí)能力的技術(shù)。Vapnik是統(tǒng)計學(xué)習(xí)理論之父,統(tǒng)計學(xué)習(xí)理論即基于既定數(shù)據(jù)的預(yù)測。預(yù)測,對人類來說似乎是一個簡單的任務(wù),實際上卻需要關(guān)于預(yù)先形成的概念和對世界的觀察的海量信息(更多是后者)。Vapnik,這一領(lǐng)域的先驅(qū),基于他在知識傳播上的興趣,繼續(xù)著這一領(lǐng)域的工作,并把師生互動時的線索運用在機器學(xué)習(xí)當中。

目標

團隊的規(guī)模和科研力量允許Facebook擁有雄心勃勃的長期目標,絕不會達不到被LeCun稱為「明確的智慧」的標準。

「迄今,最好的人工智能系統(tǒng)也是愚鈍的,因為它們沒有常識。」LeCun說道。他用一種情況舉例,比如我拿起一個瓶子,然后離開房間。(我們在紐約Facebook的會議室里討論真正的機器智能的誕生,而這個房間的名字卻不怎么吉利—— Gozer the Gozerian,與《捉鬼敢死隊》里面的反派同名。)人類的大腦不難想象出一個人拿起瓶子然后離開房間這么個簡單的場景,但對一臺機器來說,僅這個前提就會導(dǎo)致大量的信息缺失。

Yann一邊說,我一邊在心中想象這個場景:「你很可能站起來,即使我在語句中沒有提到,你也很可能走動;你打開門,走進去,也許還會關(guān)上門;瓶子不在房間里。由于知道真實世界的情況和界限,你可以借由判斷。因此我并不需要告訴你所有的細節(jié)。」

現(xiàn)在對于機器如何學(xué)習(xí)該水平的推理,人工智能領(lǐng)域的專家知道得并不多。在向這個目標邁進途中,F(xiàn)acebook正致力于制造能足夠好地學(xué)習(xí)已知世界的機器。

LeCun說:「最大的障礙是自助式學(xué)習(xí)(unsupervised learning)。」現(xiàn)在機器主要通過一兩種方式進行學(xué)習(xí),即他助式學(xué)習(xí)(supervised learning)——在系統(tǒng)中,向機器展示成千上萬的狗的圖片,直到機器了解了狗的特征。谷歌的DeepDream以研究者反轉(zhuǎn)流程以揭示出其有效性對這一方法進行了闡釋。

另一種方式是增強學(xué)習(xí)(reinforcement learning),即機器對給出的信息以是或否的二擇一的方式進行選擇,以給出一個答案。這種學(xué)習(xí)耗費的時間稍長,但是機器被強制由自身做出內(nèi)在的抉擇。當這兩種學(xué)習(xí)方式結(jié)合起來時,就會產(chǎn)生強大結(jié)果。(還記得DeepMind Atari嗎)。自助式學(xué)習(xí)不需要反饋或者輸入,LeCun表示這就是人類的學(xué)習(xí)方式。我們發(fā)現(xiàn)、得出結(jié)論,并將其加入到人類的知識庫存之中。這,被證明是一項艱巨的任務(wù)。

LeCun笑著說:「我們甚至沒有一個用以發(fā)展人工智能的基本指導(dǎo)原則,很明顯,我們在努力尋找。我們有很多點子,只是目前沒一個奏效罷了。」

真正人工智能的早期探索

但是這并不是說以前的探索沒有成果。現(xiàn)在讓LeCun激動的是關(guān)于」記憶網(wǎng)絡(luò)」的工作,其可以被整合進積卷神經(jīng)網(wǎng)絡(luò),并使它們獲得記憶保持的能力。LeCun把這個新的記憶模型比作大腦中的分別由海馬體和大腦皮層控制的短期記憶和長期記憶(LeCun厭惡把CNNs比作大腦,相反他更喜歡這個模型:一個帶有50億把手的黑箱)。

記憶單元允許研究者向該「記憶網(wǎng)絡(luò)」講說一個故事,隨后使該網(wǎng)絡(luò)回答關(guān)于這個故事的問題。

故事選自《指環(huán)王》一書。我們不把全書而是書中主要情節(jié)的簡短概述(「比爾博拿到了魔戒」)講給「記憶網(wǎng)絡(luò)」,當被問及在書中某一具體情節(jié)中魔戒在哪里,這個「記憶網(wǎng)絡(luò)」能做出簡短正確的回答。Facebook 熟悉科學(xué)官Mike Schroepfer說(他強調(diào)技術(shù)可以幫助Facebook以更高的精確度向人們展示其想看到的)這意味著它理解書中事物與時間的關(guān)系。

「通過搭建能理解世界的本質(zhì)、了解你所想要的是什么的系統(tǒng),我們就能幫助你。」 Schroepfer在三月的一個開發(fā)者報告會上說道:「我們能搭建出一個系統(tǒng),確保讓所有人可以把時間花在他們真正關(guān)心的事情上。」

FAIR團隊正在圍繞這個目標開發(fā)一個被稱為「嵌入世界」的項目。在該項目中,為了幫助機器更好的理解現(xiàn)實,F(xiàn)AIR團隊正在教它們用向量表示所有事物之間的關(guān)系,如:圖像,帖子,評論,相片及視頻等之間的關(guān)系。神經(jīng)網(wǎng)絡(luò)也在構(gòu)建一個包含了能組合媒體內(nèi)容、不同個體之間的距離等錯綜復(fù)雜內(nèi)容的體系。

嵌入世界

Lecun說通過使用這一系統(tǒng)能讓我們開始「用代數(shù)替換原因」。這表示著讓人難以置信的強大。在嵌入世界項目中開發(fā)的人工神經(jīng)網(wǎng)絡(luò)能夠根據(jù)視覺相似性將在同一地點拍攝的兩張不同照片連接起來,并能指出文字描述是否符合場景。它重建了現(xiàn)實的一種虛擬記憶,并將之在其他地方和事件的背景下進行聚類。它甚至能根據(jù)一個人之前的喜好,興趣以及數(shù)字經(jīng)歷「虛擬地表示這個人」。雖然這還只是帶有實驗性質(zhì)的,但是對Facebook 的新聞流呈現(xiàn)具有很大的影響,在跟蹤標簽上也進行了一定的使用。

有很多關(guān)于長期目標的演說,但恰恰是小的勝利讓Facebook不斷前行。在2014年6月,他們發(fā)表了一篇名為《DeepFace:縮小人類表現(xiàn)與人臉識別間差距》的文章,該文宣稱在Facebook的這項技術(shù)在人臉識別中已達到97%的準確率。Lecun說:他相信Facebook的人臉識別技術(shù)已達到世界第一,這也是Facebook與學(xué)術(shù)研究機構(gòu)的一個關(guān)鍵性的區(qū)別。現(xiàn)在,DeepFace是Facebook自動標記照片背后的驅(qū)動力。

「如果我們有一個切實有效的想法,我們就能讓它在一個月內(nèi)出現(xiàn)在15億人面前。」LeCun說,「讓我們把目光聚焦在我們的長期目標的高度上,但是,在這個過程中會有很多我們將要去實現(xiàn)的會在短期具有實用性質(zhì)的事。」

facebookai2.jpg

作為FAIR的研究成員之一的Rob Fergus(右站立),正在紐約辦公室處理有關(guān)人工智能虛擬方面的工作

作為在NYU和MIT計算機科學(xué)和人工智能實驗室工作過的老手,Rob Fergus領(lǐng)導(dǎo)著有關(guān)計算機視覺的AI團隊。他們的工作已經(jīng)在自動標記相片上得到使用,接下來將被用于標記視頻。大量視頻因為缺乏元數(shù)據(jù),或者沒有任何描述性文本,而被「淹沒」于噪聲中。AI將會能夠「觀看」視頻,并將它們大致分類。

這對Facebook阻止那些不想被上傳到他們服務(wù)器上的內(nèi)容具有巨大的意義—例如色情照片,版權(quán)問題或者其他違反他們使用條款的任何內(nèi)容。它也能鑒別新聞事件,對不同類型的視頻進行管理。Facebook此前一直將這些任務(wù)劃分給外包公司,當這項技術(shù)穩(wěn)定后,F(xiàn)acebook就能降低這部分的人工成本。

在目前的測試中,人工智能表現(xiàn)得很有希望。給它播放一段正在進行的體育視頻,比如冰球、籃球或乒乓球,人工智能能夠準確地識別出這個體育項目。并且還可以區(qū)分壘球和棒球,漂流和皮劃艇,以及籃球和街球這些類似的運動。

Facebook背后的人工智能

Facebook有一個叫做語言科技的獨立小組,主要負責(zé)開發(fā)翻譯,語言辨識和自然語言理解。LeCun所在的部門,F(xiàn)acebook人工智能研究室(FAIR)是Facebook人工智能戰(zhàn)略研究的主力,而語言科技(從屬于應(yīng)用機器學(xué)習(xí))是實際進行軟件開發(fā)的地方。

他們與FAIR合作,但獨立進行開發(fā)和實踐,并且已經(jīng)開發(fā)了493種廣泛使用的翻譯方向(從英語到法語,從法語到英語算兩種方向)。

本著讓世界更開放更連通的宗旨,語言服務(wù)是Facebook的一條必經(jīng)之路。超過一半以上的Facebook用戶不說英語,然而Facebook上大部分的內(nèi)容都是通過英語呈現(xiàn)的,語言科技小組的負責(zé)人Alan Packer說道。

約有三億三千萬用戶經(jīng)常點擊「見翻譯」按鈕使用這些翻譯服務(wù)。

如果你是第一個點擊翻譯按鈕的人,恭喜,你已經(jīng)操作了人工智能了。首次點擊會向服務(wù)器發(fā)出翻譯請求,之后該請求將存儲起來供其他用戶使用。Packer說,夏奇拉(Shakira,著名拉丁裔歌手)發(fā)布的內(nèi)容總是很快就翻譯出來了。語言科技小組還推出了本地內(nèi)容翻譯,通過點擊「見原文」按鈕可以體驗這項服務(wù)。

人工智能是這項任務(wù)里一個必要的環(huán)節(jié),因為「傻瓜」翻譯對于人們彼此之間相互溝通作用不大,還會生成不正確的語法,誤讀的習(xí)語,俚語也無從參考。這就是過去Google翻譯那種直接逐詞翻譯的缺陷。

Packer說,修辭尤其難翻譯,但人工智能可以把握一些語義層面的含義。

「如果把『熱狗(hot dog)』這個詞組按字面翻譯成法語,是說不通的。『Chaud chien』對法國人來說沒有任何意義,」Packer說道。「同樣如果你拿著一幅我滑雪的照片,我說,『我今天秀了一下滑雪技巧(I’m hot dogging it today),』這就變得很難理解,因為這里的hot dogging是炫耀的意思。」

盡管這種理解并不算太多,但早期的結(jié)果預(yù)示著這個任務(wù)很難處理。Packer說,人工智能的妙處在于它不會去理解比喻或習(xí)語,但仍會在不理解的同時認識到這一點。

人工智能本身具有適應(yīng)性,經(jīng)過訓(xùn)練后便可以很快掌握俚語。語言科技小組最近發(fā)現(xiàn)法國球迷在用一個新俚語表達「wow」,人工智能在接受那部分公用數(shù)據(jù)的神經(jīng)網(wǎng)絡(luò)訓(xùn)練以后,現(xiàn)在能夠可靠地將文本翻譯出來。他們通過每天對人工智能進行新數(shù)據(jù)的訓(xùn)練擴展Facebook的詞庫,不過所有語言的詞庫正在按月更新。

Facebook M

我們已經(jīng)習(xí)慣于個人數(shù)字助理,比如Siri,Cortana,以及Google Now。但Facebook選擇了一條不同的道路,其名為「M」的新型個人AI助理擁有超越手機界限處理復(fù)雜事物的能力。Siri可以發(fā)短信,而M可以預(yù)定航班或制定旅行計劃。在開發(fā)過程中,一位Facebook的雇員甚至讓M安排了一個找搬家公司到家中進行評估的日程。(不過當然了,你不能讓M給你買煙草、酒、槍支,或者給你安排色情服務(wù)。)

在三年內(nèi),M有可能能夠給有線電視公司或者車輛管理部門打電話,并幫用戶在線等待,直到對方的接線員接過電話。

事實上,F(xiàn)acebook M的主干來自于今年早些時候收購的一家創(chuàng)業(yè)公司:Wit.ia。他們加入了Messenger的小組,受VP David Marcus的管理,并在本月早些時候首次發(fā)布了M。

Alex LeBrun在Facebook內(nèi)部領(lǐng)導(dǎo)Wit.ai小組,他說人工智能不僅幫助M更好地完成一般的任務(wù),也能完成有一些特殊情況的任務(wù),如帶一個小嬰兒旅游,或在燈火管制日的時候旅行。這也意味著M的能力隨著人工智能的發(fā)展而發(fā)展。他樂觀地認為,在三年內(nèi),M就可能有能力呼叫有線電視公司或者車輛管理部門,并幫助用戶在線等待,直到有人接過電話。

「M這樣的服務(wù)最大的附加值在于它能夠完全滿足你的需求,甚至在你的需求比較特殊或比較奇怪的情況下,」 LeBrun 說,「在任務(wù)比較復(fù)雜或并非常理情況的時候,它也能完成任務(wù)。」

隨著M的運行,它能夠不斷學(xué)習(xí)。現(xiàn)在,它還沒有能力獨自運行。一個被稱為「AI訓(xùn)練者」的小組跟M一起工作,如果出現(xiàn)M不懂的任務(wù),小組會接管過來。隨后M可以從人類訓(xùn)練者身上學(xué)到應(yīng)該怎么做,并應(yīng)用到之后的任務(wù)中。在程序中還內(nèi)嵌了一種隨機機制,Lebrun說是為了讓它更像人類學(xué)習(xí)的過程。

「AI訓(xùn)練者」是個新的職位,F(xiàn)acebook本身也在對這個職位的探索中。他們說,這并不是一個給研究員或者工程師的職位,而是為那些擁有客戶服務(wù)經(jīng)驗的人準備的。Facebook將能夠評估哪些任務(wù)需要人類的干預(yù),但最后,他們希望在未來完成這些任務(wù)將不需要任何人類干預(yù)。

但在開發(fā)過程中,這個職位是必須的,因為他們的工作主要有兩部分:一是保證服務(wù)質(zhì)量的最后一道關(guān)卡,二是訓(xùn)練AI。

有人類智能做看門人,M可以在FAIR進行開發(fā)時當做沙盒來用。「如果有什么東西需要測試,就會在M中顯現(xiàn),因為在我們的訓(xùn)練和督導(dǎo)下,這個過程是沒有風(fēng)險的。」Lebrun說。

M平臺是完全建立在Wit.ai的平臺之上的(主要在Facebook收購前就已研發(fā)),但FAIR也會對用戶和個人AI助理的交互過程產(chǎn)生的數(shù)據(jù)用作深度學(xué)習(xí)。

Facebook在人工智能團體中的角色

「我們的研究項目都是完全公開的。幾乎我們做的每件事都會發(fā)布,大部分的代碼也都是開源的」 LeCun 說道。你可以在 Facebook 的研究網(wǎng)站上和 ArXiv——一個收納電腦科學(xué)、數(shù)學(xué)及物理研究的圖書館,找到這些出版物。

大多人工智能團體都是這樣不隱秘的。 LeCun 已成為發(fā)展 Torch(一個針對AI 發(fā)展的C++算法庫)的領(lǐng)軍人物。LeCun帶領(lǐng)他的團隊,還有 Twitter 和 Google的 DeepMind 的研究人員合作,共同發(fā)展 Torch。許多現(xiàn)今在這個領(lǐng)域的專家都曾是LeCun的學(xué)生。

任何他們可能出版的資料,從與醫(yī)學(xué)成像相關(guān)的資料到無人駕駛車,也都是公開以促進未來發(fā)展的,LeCun說道。Facebook的研究固然對他們的用戶很重要,但它的核心價值更佳體現(xiàn)在讓人類對如何更好地用機器來模仿智能的知識。

這是為什么Facebook是人工智能社區(qū)中重要的一部分,也是為什么這個社區(qū)本身是如此重要。

「那些你在好萊塢電影里看到的情節(jié),譬如一個在阿拉斯加與世隔絕的人研究出了完美運作,并在當下無人企及的人工智能系統(tǒng),是完全不可能的」。LeCun說,「這是當代最大最復(fù)雜的科學(xué)挑戰(zhàn)之一,沒有任何一個人,甚至一個大公司能夠憑他們自己解決。解決它需要整個研究發(fā)展社區(qū)的集體力量」。

關(guān)鍵字:FacebookLeCun

本文摘自:虎嗅網(wǎng)

電子周刊
回到頂部

關(guān)于我們聯(lián)系我們版權(quán)聲明隱私條款廣告服務(wù)友情鏈接投稿中心招賢納士

企業(yè)網(wǎng)版權(quán)所有 ©2010-2024 京ICP備09108050號-6 京公網(wǎng)安備 11010502049343號

^
  • <menuitem id="jw4sk"></menuitem>

    1. <form id="jw4sk"><tbody id="jw4sk"><dfn id="jw4sk"></dfn></tbody></form>
      主站蜘蛛池模板: 株洲县| 西宁市| 盐边县| 甘泉县| 沅江市| 山东省| 永宁县| 鹤庆县| 双桥区| 呼和浩特市| 昭觉县| 驻马店市| 象山县| 威宁| 桃园县| 财经| 富宁县| 乌什县| 台中市| 南汇区| 吉林市| 藁城市| 沧源| 扶绥县| 汉源县| 永丰县| 北安市| 剑河县| 宁远县| 定兴县| 汕头市| 锡林郭勒盟| 建宁县| 华宁县| 山东| 宣武区| 读书| 土默特右旗| 吉安市| 灌南县| 阿鲁科尔沁旗|