近日,谷歌人工智能研究院發布了一篇新論文,論文中介紹他們訓練了一個神經網絡來理解網頁的結構,以及它在填寫機票預訂單或社交媒體網站交互時可以作出選擇。
據介紹,這項研究采用了與谷歌AlphaZero軟件相同的機器學習類別,即所謂的“強化學習”,在RL中,神經網絡都在嘗試解決問題的每個階段,會置頂步驟策略。研究人員想出一種方法來訓練神經網絡,可以讓神經網絡找到一個具有眾多變量的問題解決方案。目前有兩種新型神經網絡,一種叫QWeb,它學習點擊鼠標并在網頁上輸入內容,另一種叫INET,它是指導者,它會指出每一步該給QWeb哪些指令。