北京時間8月27日消息,《連線》雜志網絡版今天撰文,披露了Facebook虛擬助理服務M誕生的幕后故事及工作機制。文章指出,為了開發這款產品,Facebook收購了語音識別技術公司Wit.ai,網羅了像亞恩·勒庫恩(Yann LeCun)這樣的頂尖計算機人才,同時還運用最新的人工智能技術。在做好一切準備之后,Faceboo最終打造出一款號稱比蘋果Siri等競爭對手更先進的智能產品。
Facebook推出虛擬助理服務M
以下為文章全文:
老實說,Siri真的很差勁。通常情況下,它根本不知道你在說什么。即便真的知道,它提供的答案也不過是一個充斥著網絡鏈接的頁面。
這一問題的癥結在于,蘋果的語音助理是基于過時技術開發的。即使該公司用最新的人工智能技術對Siri進行升級,它的表現也遠遠不及有血有肉、又有神經細胞的人類助理。雖然人工智能技術在過去幾年取得了很大進展,但距離真正的智能化還相當遙遠。
新的虛擬助理服務“M”的推出,意味著Facebook在很大程度上也認同這種觀點。
挑戰蘋果Siri和Google Now
M是基于該公司即時消息應用Facebook Messenger開發的,在北京時間8月2亮相,被推送到舊金山灣區數百名毫無心理準備的用戶的手機上。這是Facebook為應對Siri以及Google Now和微軟Cortana等類似產品而推出的一項服務。但是,它可以處理更廣泛的任務——至少Facebook是這樣說的。你可以問M各種各樣的問題,比如:“你能幫我預訂晚餐嗎?”、“你能幫我規劃我的下一個假期嗎?”它會一一執行這些命令。
這是因為,Facebook設計了這一工具,以便讓人工智能技術與人類相配合,對這些問題做出回應。Wit.ai創始人亞歷克斯·勒布倫(Alex Lebrun)說:“人工智能試圖做一切的事情,但人工智能是由人類控制的。”為了幫助開發這種智能手機工具,Facebook收購了Wit.ai。
在這個由人工智能驅動的私人助理的廣闊世界里,M似乎是Facebook回歸本源之舉。當Facebook面向公眾測試M這個工具時,我們并不清楚這種人機合作能否跟上時代的步伐,覆蓋比以前任何時候都多的受眾。但若以一種違反直覺的方式來看,M可能是向真正的人工智能邁近了一步。
讓人類幫助改進人工智能
Facebook開發“M”背后的想法是,人類不僅會回答人工智能所不能回答的問題,而且從長遠來看,人類也會幫助改善人工智能技術。大家明白,當前人工智能技術至少還需要人類幫助進行訓練。如果你想要獲得一套系統,希望可以在YouTube視頻中自動識別貓咪,人類必須首先將貓咪的樣子展示給這個系統看。
此外,人類必須給各種各樣貓咪的照片打標簽,還必須提供相關數據。通過人類員工對M提供幫助,Facebook正以異常復雜的方式做著此類事情。“正因為如此,我們建立了一支如此龐大的團隊,”勒布倫說。“我們需要的數據是不存在的。”在回答你的問題時,這些人類員工將提供相關數據,為一種更為復雜的數字助理提供幫助,而這種數字助理是基于一種稱為“深度學習”的人工智技術開發。
這一過程可能需要多年時間。但是,人工智能的發展方向就是這樣的。x.ai創始人兼CEO丹尼斯·莫滕森(Dennis Mortensen)說,“人類層面的人工智能是可以進行相當高深的哲學討論。這種事情是不會很快發生的。”x.ai是一家提供在線個人助理服務的創業公司,這種服務會自動為客戶安排會議時間。
新舊交替的技術
頗具諷刺意味的是,Wit.ai提供的仍是相當過時的人工智能技術。Wit.ai的技術基于兩種算法開發,一是“條件隨機域”(conditional random fields),二是“最大熵分類器”(maximum entropy classifiers)。這兩種算法已經為科技行業服務十多年了。不過,它們也為M項目尋找一種更先進的人工智能提供了一個跳板。
勒布倫在2013年創辦了Wit.ai,此前他開發了一種數字服務,幫助AT&T等移動運營商用于與客戶溝通。Wit.ai基本上提供了一種可幫助軟件程序人員開發Siri式系統的服務,這些系統可以識別語音,并在一定程度上理解自然語言。Wit.ai的服務的確是基于過時的算法所打造,但它可以逐漸學著識別語音,同時又不需要像蘋果和谷歌那樣,收集海量的語音數據。Wit.ai服務需要更少的數據,而且只要整合了許多開發者搜集的語音樣本,就可以在實踐中使用。
負責Messenger業務的Facebook副總裁戴維·馬庫斯(David Marcus)曾想方設法將這項消息服務推向更多的領域,從而給Facebook做出營收貢獻。于是,馬庫斯找到了勒布倫和他的公司。今年1月份,Facebook收購了Wit.ai這家僅有10個人的創業公司,但具體的交易金額不詳。
馬庫斯表示,憑借這一交易,Facebook將“這個世界上最擅長人與人工智能交互的團隊之一”收入麾下。但據勒布倫透露,Wit.ai當時并不清楚他們會參與開發什么樣的人與人工智能交互產品。大約3個月以后,馬庫斯、勒布倫及Wit.ai團隊的剩余人員最終敲定,基于Messenger開發一項虛擬助手服務,但它不會是另一個“Siri”。
首先,這項服務主要是通過文字而非聲音溝通。其次,它會回答各種各樣更為復雜的問題。勒布倫表示:“如今,你已經有了大量人工智能產品,如Siri、谷歌Now和微軟Cortana,但它們的應用范圍很有限。由于人工智能的這種限制,你只能在有限的場合使用。我們希望從一開始就能做更加雄心勃勃的事情,給人們他們真正想要的答案。”也就是說,這個團隊需要的不僅僅是人工智能。
離不開人類“培訓師”的幫助
當你向M提出問題,這項人工智能技術會試著理解問題,并做出回答。但是,系統不會將答案發給用戶,而是先發給人類“培訓師”——也就是類似客服的技術人員,他們與Wit.ai團隊一起工作,辦公地都在Facebook位于加州門洛帕克的新總部。這些培訓人員會決定是否還需要做其他的工作,然后再向用戶提供他們正在尋找的答案。
據勒布倫介紹,M可以從事大量相對比較簡單的任務,如講個笑話。M會對網絡段子API進行排序,如果它提供的段子很有趣,訓練師就會批準。至于相對更為復雜的任務,如在機動車管理處(DMV)的網站上進行駕照考試預約,人類本身還要做大量繁重的工作。他們會給機動車管理處打電話確認信息。
在從事此類復雜的任務時,人類“培訓師”會針對特殊問題的回答方式生成一個路線圖。“培訓師所做的每一件事情,我們都會記錄下來,”勒布倫說道。這其中包括他們訪問的網站,他們在給機動車管理處打電話時說的話,以及回復M用戶信息時輸入的內容等等。將來,這些數據將有助于開發一個基于深度學習的更先進的系統,一種全新的人工智能技術,可以通過分析一個巨大的機器網絡中的大量信息來操控很多任務。基本上,這些網絡模擬了人類大腦中的神經元網絡。
當Facebook用戶提出問題時(最上面),M的人工智能引擎便會分析他說了什么(中間),然后把分析結果發給Facebook的人類“訓練師”,后者再對用戶的問題作出回復(最下面)。
這些類似于神經的網絡已證明它們在識別圖像、辨認語音、鎖定廣告,甚至教機器人擰開瓶蓋等方面是非常有效的。在聘請了紐約大學計算機科學研究人員亞恩·勒庫恩(Yann LeCun)之后,Facebook最終在這個重要性日益凸顯的領域確立了主導地位。該公司現在可以使用類似于神經元的網絡,識別貼到社交網絡上的照片信息,并能夠確定你在信息流(News Feed)中想看什么新聞。Facebook還計劃借助M的力量進一步推進這項技術的發展。
“你知道的越多,不懂的也就越多”
為什么不從一開始就用神經網絡來打造M呢?如果沒有合適的數據,神經網絡就不能提供比Siri更為強大的服務,而Wit.ai的技術則可以在數據相對很少的情況下,打造更為強大的服務。“這是一個很好的引導方法。有了幾千個數據點之后,你就可以創建一個模型了,”勒布倫說道,“然后,通過這個模型,你又可以獲取更多的數據。你的數據點一旦達到100萬,就可以去找勒庫恩,就深度學習進行深入交流了。”
就像勒布倫所說的,這是一個雄心勃勃的計劃。他說,即使把多個神經網絡融合起來,Facebook也要在接下來的幾年里繼續使用人類訓練師。隨著M的不斷進步,它會需要更多的數據以繼續改善。“你知道的越多,發現自己不懂的也越多,”勒布倫說道。“M能做的越多,等它完成的復雜任務也越多。”
至少,這是Facebook的如意算盤。M今天剛剛發布,我們還不知道這項服務未來會如何。隨著Facebook把M介紹給越來越多的用戶,那么它需要的培訓師也將越來越多。勒布倫預計,隨著用戶數量的不斷增加,培訓師的數量也會直線上升,但由此帶來的壓力也會是巨大的。Facebook Messenger的用戶數量已經超過7億。“這很不簡單了,”勒布倫說。
數據對人工智能發展至關重要
與此同時,即使Facebook能使這個系統不斷運行下去,M的發展也不可能像勒布倫和該公司預測的那樣快。莫滕森說,實際上,讓人類與人工智能攜手工作的話,可能會降低工作效率。
莫滕森還以自動駕駛汽車為例,解釋這種短板。開發自動駕駛汽車的一種方法是:在人類司機開車的過程中,慢慢加入自動化工具。但是,如果你讓車自己行駛的話,也許它的系統發展得會更快——無論它的裝備有多么差勁。對于最終成果來說,那些小型自動化工具可能不是最關鍵的。它們可能搜集的是你不需要的信息。
但同時,莫滕森也像勒布倫和Facebook一樣,強調了數據對于人工智能發展的重要性。他說,如果M項目進展順利的話——合適的引導、記錄以及對培訓師的行為進行分類——這些人確實能夠提供一條捷徑。莫滕森說,Facebook必須關注人類在未來如何可以改善這一系統,而不僅僅是現在。那不是一件容易的事情。不過,Facebook在這方面比大多數公司都做得好。