編者按:不少人覺得會話界面是最新的技術(shù),然而事實(shí)上這個技術(shù)已經(jīng)存在了有一段時間了。從 Cleverbot 和Smarter Child 到迷宮般的電話樹,多年來我們從未停止嘗試建立模仿人類之間的互動的技術(shù)。近來這類工具的巨大進(jìn)展使它們成為人們討論未來技術(shù)的熱門話題。聊天機(jī)器人似乎已經(jīng)進(jìn)入我們生活的方方面面,但是目前的技術(shù)只能解決簡單的問題,或者以新瓶裝舊酒的方式替代了一些我們熟悉的操作流程。本文作者 Ben Ihnchak 是芝加哥用戶體驗(yàn)設(shè)計公司 Fuzzy Math 的聯(lián)合創(chuàng)始人。
得益于虛擬助手以及蘋果的 Siri 和亞馬遜的 Alexa 等聊天機(jī)器人,語音和文本的對話界面快速崛起。此外,基于文本的聊天機(jī)器人以及 Slack 和 Facebook Messenger 等消息平臺的使用率也大幅上升。以上一系列的現(xiàn)象吸引了市場的目光,同時也帶來了投資。達(dá)美樂等食品大牌企業(yè)使用虛擬助手來幫助客戶訂購食品,HealthTap 等醫(yī)療公司利用 Facebook Messenger 為患者與醫(yī)生建立聯(lián)系。
雖然這些公司已經(jīng)在各自的平臺上取得了成功,但他們也將遇到不可避免的障礙。這種技術(shù)是否能執(zhí)行我們所想的復(fù)雜任務(wù)?在什么樣的情況下,用戶會決定選擇用聊天機(jī)器疼來代替其他選項?
盡管我們還沒有完全確定的答案,但我們可以做一些有根據(jù)的猜測,當(dāng)下熱門的聊天機(jī)器人可能會面臨什么問題?
路障1:人類語言的復(fù)雜性
會話界面的現(xiàn)代化應(yīng)用程序建立在 AI 技術(shù)的進(jìn)步之上,通過無處不在連接設(shè)備對用戶的簡單請求做出回應(yīng)和處理,例如獲得一個簡單問題的答案:芝加哥的天氣怎么樣?或者完成一個快速任務(wù):提醒我在 30 分鐘內(nèi)打電話給琳達(dá)。
像軟件一樣,語言建立在隨時間發(fā)展而演變的系統(tǒng)上。然而,語言之于人類不同于軟件之于計算機(jī),人不會被規(guī)則鎖定,我們可以自由地組織句子甚至創(chuàng)造新詞來傳達(dá)消息。除了地區(qū)方言,人們獨(dú)特的語言模式通常很好理解,即使我們的語法不符合語言規(guī)則。當(dāng) Stephen Colbert(美國知名脫口秀主持人)談到“Truthiness”這個詞時,盡管這個詞當(dāng)時還不存在,但它的意思不難理解,后來這個詞成為了 2006 年年度熱詞。在歷史上,計算機(jī)在理解這樣的詞語時遇到的困難更大。機(jī)器學(xué)習(xí)促進(jìn)了語音識別,但是 AI 技術(shù)還沒有達(dá)到可以跟上語言的快速演變節(jié)奏或理解某種特定的表達(dá)方式的地步。
對于傳統(tǒng)的界面,可訪問性通常與用戶在視覺處理或物理操縱方面的能力有關(guān)。系統(tǒng)理解并響應(yīng)用戶的獨(dú)特語言模式(無論是口頭還是打字)的能力逐漸得到了加強(qiáng)。若系統(tǒng)只能理解完全符合規(guī)則的語言,那么這對大多數(shù)人來講是不實(shí)用且乏味的,他們只能重新組織語言來適應(yīng)計算機(jī)。同樣,如果系統(tǒng)不能以人們熟悉的語言模式做出回復(fù),那么產(chǎn)品制造商所希望建立的人機(jī)之間的緊密關(guān)系則永遠(yuǎn)無法實(shí)現(xiàn)。
路障2:信任和理解障礙
現(xiàn)如今我們已經(jīng)可以在服務(wù)端看到一些有效的聊天機(jī)器人,例如銀行使用的聊天機(jī)器人。
我們可以在不與工作人員通話的前提下達(dá)到目標(biāo),例如打電話給銀行查詢賬戶余額。這樣的案例實(shí)現(xiàn)了聊天機(jī)器人和人類之間的交接,自動化和個性化之間的差距得以彌合。這些互動通常具有客觀性,很適合 AI 技術(shù)的應(yīng)用。人們似乎很信任計算機(jī)提供的基本事實(shí)和數(shù)字,例如帳戶余額的查詢。
不過當(dāng)我們的需求從客觀洞察走向更主觀的思維時,事情就變得復(fù)雜了。遠(yuǎn)程醫(yī)療通過遠(yuǎn)程通信工具為患者提供醫(yī)療服務(wù),在醫(yī)療衛(wèi)生領(lǐng)域越來越受歡迎。這種方式將面對面的溝通轉(zhuǎn)換為數(shù)字方式,這種轉(zhuǎn)換之所有有效果是因?yàn)槲覀兌己芮宄h(yuǎn)程連線的兩端還是真人在交流。
如果把遠(yuǎn)程端的醫(yī)生換成聊天機(jī)器人呢?患者還會如此信任這個系統(tǒng)嗎?當(dāng)然不會。WebMD 等醫(yī)療網(wǎng)站先把癥狀列出來再給出對應(yīng)的潛在診斷方法,這樣也是比較客觀的。但是,要像醫(yī)生一樣從一系列潛在的診斷方法中做出最可行的選擇,需要復(fù)雜的理解和判斷能力。除了診斷方面的困難,如何獲得用戶的信任并使他們接受計算機(jī)得出的結(jié)果是更大的挑戰(zhàn)。
路障3:如何更易于使用?
目前,市場上的聊天機(jī)器人沒有引入全新的行為,而是用新的方法來解決舊問題。我們也可以通過網(wǎng)絡(luò)瀏覽器來檢查帳戶余額、購買衣服、訂購鮮花,這些操作過程我們都很熟悉。聊天機(jī)器人的成功應(yīng)該在于為用戶提供更好的體驗(yàn),而不僅僅是用新的方法去替代我們熟悉的流程。
對于聊天機(jī)器人的應(yīng)用,更好的體驗(yàn)在于簡單和流暢的操作過程。等待機(jī)器讀出選項列表是一個無聊的過程,尤其是當(dāng)我們可以在網(wǎng)站上快速選出合適選項時。對于某些任務(wù),聊天程序可能永遠(yuǎn)無法給出答案,因?yàn)樗鼈儾荒鼙缓喕阶阋酝瓿蛇@種界面上的工作。不過對于其他任務(wù),產(chǎn)品簡化和個性化以及有效的機(jī)器學(xué)習(xí)的組合可以幫助解決許多問題。若能更徹底地理解用戶,這些系統(tǒng)將可以提供獨(dú)特的價值并簡化任務(wù),一次對話就可以完成最簡單的交互。
展望未來
隨著時間的推移,語言處理和 AI 技術(shù)將不斷改進(jìn),為聊天機(jī)器人以最少的輸入執(zhí)行復(fù)雜的任務(wù)創(chuàng)造新的機(jī)會。大多數(shù)聊天機(jī)器人的目的是復(fù)制人類行為,若要獲得可以解決復(fù)雜問題或以更簡單的方式完成任務(wù)的 AI 技術(shù),我們還有很長一段路要走。但我們現(xiàn)在要比那個 SmarterChild 和 Moviefone 就能引起轟動的時代進(jìn)步多了,同時,大量涌入的投資也在加速技術(shù)的持續(xù)發(fā)展。
編者按:不少人覺得會話界面是最新的技術(shù),然而事實(shí)上這個技術(shù)已經(jīng)存在了有一段時間了。從 Cleverbot 和Smarter Child 到迷宮般的電話樹,多年來我們從未停止嘗試建立模仿人類之間的互動的技術(shù)。近來這類工具的巨大進(jìn)展使它們成為人們討論未來技術(shù)的熱門話題。聊天機(jī)器人似乎已經(jīng)進(jìn)入我們生活的方方面面,但是目前的技術(shù)只能解決簡單的問題,或者以新瓶裝舊酒的方式替代了一些我們熟悉的操作流程。本文作者Ben Ihnchak 是芝加哥用戶體驗(yàn)設(shè)計公司 Fuzzy Math 的聯(lián)合創(chuàng)始人。
得益于虛擬助手以及蘋果的 Siri 和亞馬遜的 Alexa 等聊天機(jī)器人,語音和文本的對話界面快速崛起。此外,基于文本的聊天機(jī)器人以及 Slack 和 Facebook Messenger 等消息平臺的使用率也大幅上升。以上一系列的現(xiàn)象吸引了市場的目光,同時也帶來了投資。達(dá)美樂等食品大牌企業(yè)使用虛擬助手來幫助客戶訂購食品,HealthTap 等醫(yī)療公司利用 Facebook Messenger 為患者與醫(yī)生建立聯(lián)系。
雖然這些公司已經(jīng)在各自的平臺上取得了成功,但他們也將遇到不可避免的障礙。這種技術(shù)是否能執(zhí)行我們所想的復(fù)雜任務(wù)?在什么樣的情況下,用戶會決定選擇用聊天機(jī)器疼來代替其他選項?
盡管我們還沒有完全確定的答案,但我們可以做一些有根據(jù)的猜測,當(dāng)下熱門的聊天機(jī)器人可能會面臨什么問題?
路障1:人類語言的復(fù)雜性
會話界面的現(xiàn)代化應(yīng)用程序建立在 AI 技術(shù)的進(jìn)步之上,通過無處不在連接設(shè)備對用戶的簡單請求做出回應(yīng)和處理,例如獲得一個簡單問題的答案:芝加哥的天氣怎么樣?或者完成一個快速任務(wù):提醒我在 30 分鐘內(nèi)打電話給琳達(dá)。
像軟件一樣,語言建立在隨時間發(fā)展而演變的系統(tǒng)上。然而,語言之于人類不同于軟件之于計算機(jī),人不會被規(guī)則鎖定,我們可以自由地組織句子甚至創(chuàng)造新詞來傳達(dá)消息。除了地區(qū)方言,人們獨(dú)特的語言模式通常很好理解,即使我們的語法不符合語言規(guī)則。當(dāng) Stephen Colbert(美國知名脫口秀主持人)談到“Truthiness”這個詞時,盡管這個詞當(dāng)時還不存在,但它的意思不難理解,后來這個詞成為了 2006 年年度熱詞。在歷史上,計算機(jī)在理解這樣的詞語時遇到的困難更大。機(jī)器學(xué)習(xí)促進(jìn)了語音識別,但是 AI 技術(shù)還沒有達(dá)到可以跟上語言的快速演變節(jié)奏或理解某種特定的表達(dá)方式的地步。
對于傳統(tǒng)的界面,可訪問性通常與用戶在視覺處理或物理操縱方面的能力有關(guān)。系統(tǒng)理解并響應(yīng)用戶的獨(dú)特語言模式(無論是口頭還是打字)的能力逐漸得到了加強(qiáng)。若系統(tǒng)只能理解完全符合規(guī)則的語言,那么這對大多數(shù)人來講是不實(shí)用且乏味的,他們只能重新組織語言來適應(yīng)計算機(jī)。同樣,如果系統(tǒng)不能以人們熟悉的語言模式做出回復(fù),那么產(chǎn)品制造商所希望建立的人機(jī)之間的緊密關(guān)系則永遠(yuǎn)無法實(shí)現(xiàn)。
路障2:信任和理解障礙
現(xiàn)如今我們已經(jīng)可以在服務(wù)端看到一些有效的聊天機(jī)器人,例如銀行使用的聊天機(jī)器人。
我們可以在不與工作人員通話的前提下達(dá)到目標(biāo),例如打電話給銀行查詢賬戶余額。這樣的案例實(shí)現(xiàn)了聊天機(jī)器人和人類之間的交接,自動化和個性化之間的差距得以彌合。這些互動通常具有客觀性,很適合 AI 技術(shù)的應(yīng)用。人們似乎很信任計算機(jī)提供的基本事實(shí)和數(shù)字,例如帳戶余額的查詢。
不過當(dāng)我們的需求從客觀洞察走向更主觀的思維時,事情就變得復(fù)雜了。遠(yuǎn)程醫(yī)療通過遠(yuǎn)程通信工具為患者提供醫(yī)療服務(wù),在醫(yī)療衛(wèi)生領(lǐng)域越來越受歡迎。這種方式將面對面的溝通轉(zhuǎn)換為數(shù)字方式,這種轉(zhuǎn)換之所有有效果是因?yàn)槲覀兌己芮宄h(yuǎn)程連線的兩端還是真人在交流。
如果把遠(yuǎn)程端的醫(yī)生換成聊天機(jī)器人呢?患者還會如此信任這個系統(tǒng)嗎?當(dāng)然不會。WebMD 等醫(yī)療網(wǎng)站先把癥狀列出來再給出對應(yīng)的潛在診斷方法,這樣也是比較客觀的。但是,要像醫(yī)生一樣從一系列潛在的診斷方法中做出最可行的選擇,需要復(fù)雜的理解和判斷能力。除了診斷方面的困難,如何獲得用戶的信任并使他們接受計算機(jī)得出的結(jié)果是更大的挑戰(zhàn)。
路障3:如何更易于使用?
目前,市場上的聊天機(jī)器人沒有引入全新的行為,而是用新的方法來解決舊問題。我們也可以通過網(wǎng)絡(luò)瀏覽器來檢查帳戶余額、購買衣服、訂購鮮花,這些操作過程我們都很熟悉。聊天機(jī)器人的成功應(yīng)該在于為用戶提供更好的體驗(yàn),而不僅僅是用新的方法去替代我們熟悉的流程。
對于聊天機(jī)器人的應(yīng)用,更好的體驗(yàn)在于簡單和流暢的操作過程。等待機(jī)器讀出選項列表是一個無聊的過程,尤其是當(dāng)我們可以在網(wǎng)站上快速選出合適選項時。對于某些任務(wù),聊天程序可能永遠(yuǎn)無法給出答案,因?yàn)樗鼈儾荒鼙缓喕阶阋酝瓿蛇@種界面上的工作。不過對于其他任務(wù),產(chǎn)品簡化和個性化以及有效的機(jī)器學(xué)習(xí)的組合可以幫助解決許多問題。若能更徹底地理解用戶,這些系統(tǒng)將可以提供獨(dú)特的價值并簡化任務(wù),一次對話就可以完成最簡單的交互。
展望未來
隨著時間的推移,語言處理和 AI 技術(shù)將不斷改進(jìn),為聊天機(jī)器人以最少的輸入執(zhí)行復(fù)雜的任務(wù)創(chuàng)造新的機(jī)會。大多數(shù)聊天機(jī)器人的目的是復(fù)制人類行為,若要獲得可以解決復(fù)雜問題或以更簡單的方式完成任務(wù)的 AI 技術(shù),我們還有很長一段路要走。但我們現(xiàn)在要比那個 SmarterChild 和 Moviefone 就能引起轟動的時代進(jìn)步多了,同時,大量涌入的投資也在加速技術(shù)的持續(xù)發(fā)展。