Facebook最近發布了CommAI-env,一個用于訓練和評價AI系統的平臺。這個平臺是受一個機器智能的路線圖啟發,旨在教授智能代理一般的學習能力,作為進一步、更專業的、通過人類或機器級的互動培訓的基礎。
CommAI的工作原理是通過工作平臺分配任務給學習者,如果學習者能給出正確的答案,就會再給予獎勵。這種類型的互動能訓練系統去通過獎勵,識別正確或不正確的答案。任務千變萬化,從最簡單的沉默-不沉默,到越來越復雜的、需要學習者長期記憶的任務,所有都在同一次訓練環節里完成。
與OpenAI Gym或MazeBase等相似的系統相比,這是一個但不是唯一的區別因素。通過消除在訓練和測試集之間的流行的界限,系統旨在概括學習者學習新的、未知的問題的能力,以及快速解決簡單的、過去見過的問題的能力。
學習者算法的接口定義了兩個函數。
next(self, input_bit)作為算法的輸入,接收工作平臺的一段輸入,并且由學習者返回下一段內容。
reward(self, reward)將為學習者提供從工作平臺中獲得的獎勵。
追逐獎勵的迭代工作將在學習過去數據和適應新難題的過程中訓練算法。
培訓平臺為開發者提供綁定,可以使用任何編程語言定義學習者通過ZeroMQ消息隊列進行學習。該項目仍然處在Beta測試階段,它有一個Facebook群對其進行討論和提供支持。該平臺代碼是用Python寫的,代碼在GitHub上托管。
查看英文原文:CommAI, a Training and Testing AI System by Facebook