在過去的一年中,機器人已經可以在許多簡單的零和博弈(零和游戲)中擊敗人類。來自國際計算機科學家團隊的一項新研究著手開發一種新型的博弈算法 - 其可以依靠協作和妥協等特性來進行博弈,而且研究人員已經發現,機器已經可以比人類更好地部署這些特性。
國際象棋,圍棋和撲克都是敵對的游戲,兩個或兩個以上的玩家相互沖突。像這樣的游戲提供了明確的里程碑來衡量人工智能的發展進程。但人工智能最終要運行的許多真實世界的場景需要人與機器之間更復雜的長期關系。
新研究的主要作者Jacob Crandall表示:“最終目標是我們了解與人合作背后的數學,以及人工智能發展社交技能所需的屬性。人工智能需要能夠對我們做出回應并闡明它在做什么,它必須能夠與其他人進行互動。”
該團隊創建了一種名為S#的算法,并在機器,人機或人與人之間的各種雙人游戲中測試其性能。所選的例子包括《囚徒困境》和《夏普利博弈》等,都要求玩家進行不同程度的合作或妥協。結果表明在大多數情況下,機器在游戲中勝過人類。
Crandall認為:“如果兩個人相互坦誠,忠誠,那么就能像兩臺機器一樣完美地完成。事實上,大約一半的人類在某種程度上說謊,所以從本質上講,這種特定的算法正在學習道德特征是好的,它被編程為不撒謊,并且一旦出現就學會維持合作。”
算法中融入了一項有趣的技術,就是機器參與研究人員稱之為“廉價交談”(cheap talk)的能力。這些機器部署是為了響應合作的姿勢,或作為對另一個參與者撒謊或作弊的反應。當這些機器部署“廉價交談”時,人們普遍無法挑選他們在和機器博弈,而在大多數情況下,這些意見使合作的數量翻了一番。
研究人員表示,這些發現可能為未來更好的自主機器奠定基礎,因為像無人駕駛汽車這樣的技術需要機器與人類和其他機器通常不能共享相同的目標。
Crandall表示:“在社會上,人際關系一直在瓦解。許多人多年的朋友一下子成為了敵人,因為機器往往比我們做得更好,所以可以教會我們如何做得更好。”
這項研究發表在《自然·通訊》雜志上。