4

據我所知,NEAT(Augmenting Topologies的Neuroevolution)是一種使用進化概念來訓練神經網絡的算法。另一方面,強化學習是一種機器學習,具有「獎勵」更多成功節點的概念。NEAT vs增強學習

這兩個字段之間有什麼區別,因爲它們看起來很相似?或者NEAT來自強化學習?

回答

5

總之,他們幾乎沒有什麼共同點。

NEAT是進化方法。這是優化功能的黑匣子方法。在這種情況下 - 神經網絡(可以很容易地測量)的性能。到它的架構(你在進化過程中改變它)。

強化學習是關於代理人,學習政策在環境中表現良好。因此他們解決了不同的,更復雜的問題。從理論上講,你可以學習使用RL的NEAT,因爲你可能會提出「給定一個神經網絡作爲一個狀態,學習如何修改它以獲得更好的性能」。關鍵的區別將是 - NEAT輸出是一個網絡,RL輸出是策略,算法的策略。在某些環境中可以多次使用的東西,採取行動並獲得獎勵。

+1

兩種方法都非常不同,正如您所說,通常在不同的環境中使用。但強化學習並不一定能解決更多「複雜」的問題(參見:https://arxiv.org/pdf/1703.03864.pdf) – Pablo