国产日韩欧美成人,中文精品视频一区二区在线观看,亚洲国产欧美另类

Facebook訓(xùn)練機(jī)器人討價(jià)還價(jià) 教它們與人類談判

責(zé)任編輯：editor004

2017-06-16 10:53:18

摘自：澎湃新聞

隨著亞馬遜Echo和谷歌(微博)Home 的走紅，智能語音機(jī)器人越來越受到歡迎。但眼下，F(xiàn)acebook已經(jīng)不滿足于研發(fā)一款可以聊天的智能語音助手

隨著亞馬遜Echo和谷歌(微博)Home 的走紅，智能語音機(jī)器人越來越受到歡迎。但眼下，F(xiàn)acebook已經(jīng)不滿足于研發(fā)一款可以聊天的智能語音助手，而是要訓(xùn)練機(jī)器人與人類進(jìn)行談判。

6月15日，據(jù)科技博客Techcrunch報(bào)道，F(xiàn)acebook人工智能研究所（Facebook Artificial Intelligence Research，簡稱FAIR）的研究人員已經(jīng)創(chuàng)建了人工智能模型，它們被賦予了與人類談判的能力，可以與人討價(jià)還價(jià)。

目前FAIR的研究人員已經(jīng)開放了該模型的源代碼，并發(fā)表論文，介紹了該機(jī)器人所具有的談判能力。在論文中，研究人員表示，通過大量的訓(xùn)練，對于具有不同目標(biāo)的對話機(jī)器人，已經(jīng)可以與其他機(jī)器人或人類進(jìn)行從開始到結(jié)束的談判，并最終達(dá)成一致結(jié)果和目標(biāo)。

Facebook研究人員指出，現(xiàn)實(shí)生活中人們經(jīng)常需要面對的“討價(jià)還價(jià)”就是最常見的一種談判行為。他們從這一行為模式入手，開始教機(jī)器人如何分配物品，譬如五本書、三頂帽子、兩個(gè)球等等。每一場談判被限定在10次對話之內(nèi)，如果10次對話結(jié)束后，沒有達(dá)成共識，那么雙方都不能得到物品。

為了達(dá)到訓(xùn)練效果和進(jìn)行大規(guī)模的定量評估，F(xiàn)AIR團(tuán)隊(duì)收集了一系列人與人之間討價(jià)還價(jià)的記錄供機(jī)器學(xué)習(xí)。這些案例詳細(xì)記錄了人們給一組物品定價(jià)并進(jìn)行分配的過程。然后研究人員建立了一個(gè)遞歸的神經(jīng)網(wǎng)絡(luò)，通過教它模仿人們的行為來學(xué)會談判。

工程師們還利用機(jī)器人與機(jī)器人的對話來改善學(xué)習(xí)結(jié)果，方法是讓一個(gè)機(jī)器人生成數(shù)據(jù)去“愚弄”另一個(gè)機(jī)器人。這個(gè)場景需要機(jī)器人與另一方建立對話模型，雙方間就交易展開談判，從而預(yù)判出對方對特定報(bào)價(jià)的反應(yīng)，而采取具體應(yīng)對措施，而非簡單的模仿。在訓(xùn)練過程中，研究人員很快發(fā)現(xiàn)，機(jī)器人學(xué)會了一些談判策略，比如故意強(qiáng)調(diào)一些低價(jià)的物品，假裝讓對方認(rèn)為該物品擁有更高的價(jià)值。

FAIR團(tuán)隊(duì)的工作人員向Techcrunch表示，他們訓(xùn)練機(jī)器人的目的是教會他們防止做出不好的決策，而不是每次都作出最優(yōu)的選擇。“就像你用日歷提醒自己開會，是為了保證會議能如期參加，而不是為了選在最好的時(shí)間開會。”工作人員稱。

在2016年的開發(fā)者大會上，F(xiàn)acebook的創(chuàng)始人兼首席執(zhí)行官馬克·扎克伯格（Mark Zuckerberg）就像外界介紹過類似的應(yīng)用場景，在這個(gè)場景中，人們通過機(jī)器人與企業(yè)互動，例如，訂購產(chǎn)品或獲得客戶服務(wù)幫助。

不過目前，F(xiàn)AIR還沒有深入研究什么這種機(jī)器人的討價(jià)還價(jià)能力可能適用于哪些應(yīng)用軟件，也沒有表示這種能力是否會在Facebook的產(chǎn)品中出現(xiàn)。FAIR在論文中指出，辯論、對話和談判的能力對進(jìn)一步開發(fā)并提升聊天機(jī)器人是非常重要的，訓(xùn)練機(jī)器人學(xué)會談判過程中的所有重要步驟都是打造個(gè)性化數(shù)字助理的關(guān)鍵。

Facebook 谷歌訓(xùn)練過程