微軟全球執(zhí)行副總裁沈向洋在昨天的人工智能大會上做了精彩演講,與普遍的討論人工智能技術(shù)和應(yīng)用不同,沈向洋提出了許多獨特的且富有哲理的觀點,他結(jié)合小冰等微軟研究院的相關(guān)產(chǎn)品和技術(shù)描述了情感智能的原理、應(yīng)用現(xiàn)狀和發(fā)展方向,他認(rèn)為,除了硬性的IQ以外,人工智能的研究更要強(qiáng)調(diào)機(jī)器與人之間的感性化交互,強(qiáng)調(diào)情感計算。智能化的機(jī)器在滿足人類需求的同時,還應(yīng)讓用戶對其產(chǎn)生一種情感上的信任和依賴,而小冰目前就是這樣一個“感性化的人工智能助手”。
1、情感計算的重要性
如沈向洋在演講中所說,我們在談?wù)撊斯ぶ悄軙r勢必要談一下圖靈測試,勢必會去強(qiáng)調(diào)機(jī)器的IQ。機(jī)器通過感知計算提升IQ水平固然重要,但按照人工智能最為通行的定義——“人工智能是對計算機(jī)系統(tǒng)如何能夠履行那些只有依靠人類智慧才能完成的任務(wù)的理論研究。”這里的人類智慧當(dāng)然不是單指智商或者智力,還有人類情感,情感是人類神經(jīng)系統(tǒng)對外界價值關(guān)系產(chǎn)生的主觀反映。人工智能在我們眼中一直不是普通的智力工具,所以我們一方面需要它具備超越人類的感知計算能力,另一方面也需要它能夠與人進(jìn)行情感交流,在重視人工智能完成任務(wù)和功能強(qiáng)化的同時更要建立和滿足人的情感和心理需求,這才是人工智能的最終定義。也就是說,人工智能的發(fā)展路徑不應(yīng)該一味沿著理性的路線前行,而是應(yīng)該落在沈向洋在演講中提到的感性和理性的交叉區(qū)域。
從實際應(yīng)用來看,也出現(xiàn)了越來越多具備情感計算能力、能與人類進(jìn)行感性交互的技術(shù)和產(chǎn)品。MIT教授、TED講者雪莉·特克在《一起孤獨》一書中提出,社交本能使人類很容易將社交關(guān)系投射到各種各樣的人和事物上,當(dāng)一件物品在我們的關(guān)懷下茁壯成長時,我們會覺得它是智能的。但更重要的是,我們會覺得自己與它形成了某種關(guān)系。我所說的這種關(guān)系并不是來源于計算機(jī)真實的情感或智能,因為它們根本沒有。這種關(guān)系,來自于我們自身被它們所喚起的部分。她所說的物品包括能激發(fā)孩子情感依戀的玩偶,比如菲比小精靈和真娃娃機(jī)器人玩偶。更有甚者,是一只叫帕羅的機(jī)器海豹,用來充當(dāng)老年人的伴侶動物。羅切斯特大學(xué)的羅杰波教授與AdobeResearch合作開發(fā)了一種比現(xiàn)有技術(shù)更精確的訓(xùn)練電腦處理圖像數(shù)據(jù)的方法,受過這種訓(xùn)練的電腦可以被用來探測圖像中更可能流露出的情感因素,可以用來衡量經(jīng)濟(jì)指標(biāo)或用來預(yù)測大選結(jié)果。Affectiva可以通過處理人臉圖像實時捕捉和量化情感,而 SociometricSolutions可以通過語音語調(diào)做同樣的事情。在法律調(diào)查過程中,計算機(jī)能識別相關(guān)的詞匯和短語,還能理解事件鏈、人際關(guān)系,甚至是情感和動機(jī)。
對于微軟來說,更是將對人工智能情感計算的思想注入到了小冰的開發(fā)和運營中,微軟認(rèn)為,在人工智能領(lǐng)域內(nèi),新一代人工智能系統(tǒng)的首要任務(wù)就是需要具備“感性”的情感連接能力,這樣才能以更像真實人類的方式滿足人們普遍心理和情感需求,從而逐步建立信任和依賴感。在技術(shù)和產(chǎn)品創(chuàng)新層面,微軟構(gòu)建了一個完整可持續(xù)的對話系統(tǒng),這個對話系統(tǒng)的基本任務(wù)不是以完成任務(wù)為優(yōu)先,而是建立情感連接為優(yōu)先。構(gòu)建這個對話系統(tǒng)的方法,已不只限于語義學(xué),而是基于搜索引擎、大數(shù)據(jù)和機(jī)器學(xué)習(xí)的系統(tǒng)模擬方法。最終希望讓小冰這樣的人工智能產(chǎn)品快速普及到千家萬戶,成為人們?nèi)粘I畹囊徊糠帧男”诘谌狡脚_的智能聊天應(yīng)用,到與東航合作的航空智能服務(wù),再到近期的小冰面試官,這些都是在與用戶進(jìn)行情感交互,都是情感人工智能的具體體現(xiàn)。
這樣,用戶就會產(chǎn)生對機(jī)器的“依賴性”(沈向洋語),而這種依賴性再促使機(jī)器為用戶提供更好的服務(wù),滿足用戶更多的情感需求。比如沈向洋提到小冰通過動態(tài)決策具有了情感記憶功能,當(dāng)前一天某個用戶提到了自己一些心情,小冰會注意到這一點,后面的很長時間還會反復(fù)了解用戶的情況,詢問用戶的身體有沒有好一點。因此,比起直接解決問題的感知計算型人工智能,情感計算是先與用戶建立一種信任關(guān)系,然后在此基礎(chǔ)上形成一種情感交流和需求滿足的良性循環(huán)。
2、如何實現(xiàn)情感計算
情感計算在人工智能的發(fā)展過程中將發(fā)揮至關(guān)重要的作用,我們也看到了越來越多的具有“情感”的產(chǎn)品,但這僅僅是一個開始,面對人類情感這個異常復(fù)雜且人類自身都沒有完全弄懂的問題,人工智能還有很長的路要走,但好在我們現(xiàn)在發(fā)現(xiàn)了正確的路徑——我們不需要弄懂人類情感的本質(zhì),只需要讓機(jī)器對情感表達(dá)的各種信號(面部表情、語言、語音等)進(jìn)行分析并輸出結(jié)果就可以了。就像我們目前雖然無法完全破譯大腦,但我們依然能夠從功能出發(fā)研發(fā)出智能化的機(jī)器一樣。
沈向洋在回答“小冰目前是否具有了情感”時提到,人類情感的東西,實際上隱性的包含在數(shù)據(jù)里面,小冰之所以能夠?qū)Χ祟惽楦校且驗榻裉炜梢越柚谶\算能力和算法去收集和分析用戶的數(shù)據(jù),然后產(chǎn)生這樣的情感分析能力,小冰用這樣的能力反過來再去跟用戶進(jìn)行交流。而其他具有“情感”的機(jī)器人也是基于這種原因,比如,軟銀推出的情感陪護(hù)機(jī)器人Pepper讀懂人類情感的方式是對人類的面部表情進(jìn)行分析,實際上是圖像識別技術(shù);而神經(jīng)科學(xué)公司Innerscope 可以通過觀察電影中那些讓觀眾的大腦高度活躍的高光時刻來預(yù)測該這部電影能否一鳴驚人,這也是一種對大腦某些區(qū)域電信號的物理檢測,也不是真正弄清楚了大腦為何興奮。
我們現(xiàn)在可能無法弄懂人類情感的本質(zhì),但我們可以找到對應(yīng)各種情感的表現(xiàn)信號,比如寂寞對應(yīng)的文字,開心對應(yīng)的表情,憤怒對應(yīng)的語調(diào),興奮對應(yīng)的腦電波,等等,機(jī)器通過對這些信號的分析就能找出所對應(yīng)的情感,從而做到了讀懂人類的情感和表達(dá)自己的情感,這樣機(jī)器就具有了與人類進(jìn)行情感交互的能力。就像MIT 教授特克所說,我們對社交的內(nèi)在渴望讓我們不僅很容易將情感傾注在機(jī)器上,而且還是傾注在那些不可能真正愛我們的機(jī)器上。
3、大數(shù)據(jù)在情感計算中的重要性
現(xiàn)在的人工智能已經(jīng)具備了一些基礎(chǔ)的,或者說是簡單的情感,但離與人類實現(xiàn)完全沒有偏差的情感交流還有許多重要的工作的去做,其中一項就是數(shù)據(jù)的采集。沈向洋在演講中表示,現(xiàn)在的人工智能還是停留在感知這個層面,比如計算機(jī)識別、計算機(jī)語音,真正的認(rèn)知還需要一些時間,包括情感,今天最大的問題還是我們收集的數(shù)據(jù)不夠好,使得我們很多事情不能做。
得益于互聯(lián)網(wǎng)、社交媒體、移動設(shè)備和廉價的傳感器,這個世界產(chǎn)生的數(shù)據(jù)量急劇增加。隨著對這些數(shù)據(jù)的價值的不斷認(rèn)識,用來管理和分析數(shù)據(jù)的新技術(shù)也得到了發(fā)展。大數(shù)據(jù)是人工智能發(fā)展的助推劑,這是因為有些人工智能技術(shù)使用統(tǒng)計模型來進(jìn)行數(shù)據(jù)的概率推算,比如圖像、文本或者語音,通過把這些模型暴露在數(shù)據(jù)的海洋中,使它們得到不斷優(yōu)化,或者稱之為“訓(xùn)練”——現(xiàn)在這樣的條件隨處可得。
拿近幾年比較火的深度學(xué)習(xí)來說,它善于在高維度的數(shù)據(jù)中摸索出錯綜復(fù)雜的結(jié)構(gòu),因此能應(yīng)用在許多不同的領(lǐng)域,除了圖像識別和語音識別,它還在許多方面擊敗了其他機(jī)器學(xué)習(xí)技術(shù),在自然語言理解方面,特別是話題分類、情感分析、問答系統(tǒng)和語言翻譯等不同的任務(wù)上。深度學(xué)習(xí)擅長進(jìn)行情感分析,但如果把深度學(xué)習(xí)看成是人工智能起飛的發(fā)動力,那數(shù)據(jù)就是這臺發(fā)動機(jī)的燃料。因此,對于情感計算來說,大數(shù)據(jù)和數(shù)據(jù)挖掘非常重要。
正是因為數(shù)據(jù)對人工智能的重要性,眾多科技巨頭都在盡可能多的收集用戶數(shù)據(jù),搜索引擎可以記錄用戶的上網(wǎng)行為習(xí)慣;社交網(wǎng)絡(luò)可以對用戶發(fā)布的語言和圖像內(nèi)容進(jìn)行分析,等等。而微軟小冰是通過一種開放式的合作來獲取數(shù)據(jù)。微軟已經(jīng)與包括新浪微博、京東、小米、東方航空公司、美圖秀秀等企業(yè)達(dá)成了戰(zhàn)略合作;日本版小冰將登陸Line平臺;小冰會成為Windows10里面非常重要的一部分。借助于微軟自身的操作系統(tǒng)系統(tǒng)和其他第三方平臺,小冰正在滲透到用戶生活的方方面面,帶去智能化的服務(wù)和情感化的交流,在這個過程中也收獲了海量數(shù)據(jù),這些數(shù)據(jù)將反過來促進(jìn)小冰情感計算的進(jìn)步。
4、視覺信息和情感計算
對于數(shù)據(jù)采集來說,視覺化信息在其中占有舉足輕重的作用。沈向洋作為計算機(jī)視覺和圖形學(xué)研究的世界級專家,在演講中也對圖像識別技術(shù)做了重要闡述。沈向洋表示,人類對外界信息的獲取91%是通過視覺的方式,而機(jī)器要想和人類進(jìn)行更好的情感交互,也需要具備強(qiáng)大的計算機(jī)視覺系統(tǒng)。
沈向洋說,在學(xué)術(shù)界里有一個比賽,識別一千類物體誤差是多少,一直到4年前誤差都相當(dāng)大,但是由于深度學(xué)習(xí)的出現(xiàn),現(xiàn)在的誤差率達(dá)到接近人類的5.1%,而微軟研究院今年2月份做出來的系統(tǒng)第一次打敗了人類的記錄,達(dá)到4.9%。在圖像識別領(lǐng)域,微軟即將發(fā)布小冰的圖像識別系統(tǒng),它不僅是識別出圖像中的內(nèi)容,而且依然堅持它的原則——與人類進(jìn)行情感交流;小冰還和美圖秀秀展開合作,根據(jù)合影里人面部情況、性別情況、距離位置信息、表情、面容相似度來判斷出這些人之間的關(guān)系;此外,小冰還有識別年齡和衣服搭配的能力,它就會給你一個從臉到衣服的整體的視覺年齡的判斷,換一件衣服視覺年齡又會發(fā)生變化。;Windows發(fā)布時,小冰會有自己的基于多個系統(tǒng)的審美功能,所以它可以告訴你同一張臉在90后的女生和80后的男生心目中是完全不同的審美結(jié)論。
總之,小冰基于圖像識別技術(shù)打造的這些功能還是圍繞在與用戶進(jìn)行情感交流的核心思想上,不管是圖像的內(nèi)容識別,還是用戶關(guān)系分析和用戶特征分析,這些其實都是一些好的開場白,借此讓機(jī)器和用戶迅速建立起信任關(guān)系,讓機(jī)器有機(jī)會充當(dāng)用戶的感性化助手,讓用戶對小冰更加依賴。
5、情感計算的未來
沈向洋說,小冰已經(jīng)建立了一個幾千萬的人類和機(jī)器人之間的專屬關(guān)系,這幫助小冰形成了一個自我進(jìn)化的循環(huán)過程。也就是說技術(shù)產(chǎn)生產(chǎn)品,產(chǎn)品被用戶使用,隨著用戶的使用過程,在反過來幫助我們整個人工智能的技術(shù)進(jìn)一步的取得快速的自我迭代和進(jìn)化。
小冰可以在半夜與用戶聊天,可以為用戶帶來樂趣和服務(wù),其內(nèi)在的情感計算屬性決定了它已經(jīng)慢慢成為了用戶生活中的一部分,對許多人的生活產(chǎn)生了重要影響。小冰的進(jìn)化過程是人工智能中情感計算的縮影,我們對于人工智能的訴求不應(yīng)僅限于比特的流動,還應(yīng)該在于一種情感的表達(dá),因為工具可以被取代,效率可以逐步被提高,數(shù)據(jù)可以失去價值,但機(jī)器和用戶之間因為情感互動和需求滿足所形成的那種循環(huán)卻將一直持續(xù)。