11月3日,Facebook展示了其在人工智能研究領域的新進展。最引人注目的莫過于基于語音輸入而開發的圖片交互問答系統"可視問答"(Visual Q&A),它可以語音回答用戶關于臉書網站上照片的提問。臉書通過 “深度學習”的人工智能方法,使得聽者能通過一種更為直觀的方式獲得正常情況下很難理解的現存數據。所謂“深度學習”,主要基于卷積神經網絡與更加先進的端對端的記憶網絡,通過組合低層特征形成更加抽象的高層表示屬性類別或特征,以發現數據的分布式特征表示。
該技術將允許Facebook可以理解照片當中的內容,在新聞源當中向用戶顯示他們喜歡看的照片。
Facebook可以根據用戶在圖片交互問答中的行為以及信息流中帖子閱讀時長追蹤到用戶閱讀喜好,確定用戶感興趣的主要話題,并通過上述人工智能方法對已有照片進行處理,將內容轉換成自然語言的描述與用戶的典型閱讀內容進行匹配,然后根據用戶偏好在用戶信息流中推薦更加吸引眼球的圖片及相關性更大的廣告。比如Facebook跟蹤到用戶一直發送嬰兒相關照片或者跟包含嬰兒的圖片進行交互,系統就能智能推出更多母嬰的廣告。這樣的技術未來也有可能被用于Facebook照片應用Moments。
相同技術還可以幫助視障用戶。AI解讀一張照片內容,然后用自然語言告訴視障用戶照片的內容。Facebook首席技術官Mike Schroepfer這樣介紹:“想象一下這對于全球2.85億視覺障礙人士、甚至對于四千萬盲人的意義。當朋友們在臉書上發布照片動態時,他們不再是局外人,而能與大家一起分享。”
目前,Facebook還未準備好將這款APP上架,但已允許一些人試用。
斯瑞普菲曾在今年3月的F8開發者會議上現場展示這一功能。Facebook演示了新聞源中一張男人玩滑板的照片,其研發的人工智能計算機解構了照片內容,使用文字描述了其中的內容。它把照片內容分解成“一個滑板,一個男人,一個絕招,他的滑板”,它認為可能已經發生的事情是“做的,玩滑板,正在做”。
對于其他公司來說,谷歌和百度也在運用深度學習技術使產品更加智能化。
除了展示了人工智能系統Visual Q&A,臉書公司也公布了這一系統電腦版的最新進展。斯瑞普菲在博客中寫到,“我們的團隊開發的這一研究系統,不僅成功教會了機器應答能力,篩選圖片更比同類其他系統快百分之三十,所需訓練數據也比行業基準少十倍。”
此外,Facebook也宣布了它在計算機視覺方面做出的改進,其計算機現可對虛擬堆疊塊是否會倒落做出推論,精確度達90%。
臉書的研究者們還在嘗試教電腦聰明地下中國圍棋。“我們訓練出的圍棋選手,即將達到與人類中最好的棋手一較高下的水平。雖然研究只進行了幾個月,我們的系統已經可以與其他已經發布的系統相比,達到較強的業余圍棋玩家水平。”
或許這聽上去只向一個娛樂應用,像1997年IBM超級計算機“深藍”曾經與國際象棋大師加里·卡斯帕羅夫對戰一樣。但臉書已經擁有了十五億用戶,在未來可能有更多的人會用到這一人工智能技術。