回答
有些明確的目標是解決強化學習問題的進化方法。該子領域通常以學習分類器系統(LCS)的名稱或偶爾以遺傳學機器學習(GBML)爲名。
除此之外,我不確定你的問題有一個非常明確的答案。它基本歸結爲「什麼是機器學習?」我們都沒有就如何回答這個問題達成一致。對於某些人來說,EC可能是該子域的一部分。對於其他人而言,並非如此。我剛從我的書架上抽取了幾本ML教科書,其中大約一半載有進化方法的資料。我懷疑15年前,這個比例會更高,但時尚會發生變化,機器學習現在幾乎是統計學的一個子領域。 EC方法不適合該模具。
進化計算或進化算法是優化算法,它應用於神經網絡(如神經進化)當然可以歸類爲強化學習的一種形式,雖然它的工作原理與通常的不同強化學習算法。
一般來說,在進化算法如遺傳算法或進化策略中,你有一個完整的個體需要優化。對於每一個人來說,一個質量函數被用來確定他們的「適應性」(就像'適者生存'一樣),而最好的個體被選爲下一代。那些'父母'然後被隨機地複製,修改,變異或甚至相互重組 - 這些完成的方式在每種不同的算法中都有所不同。最後,這些新的突變和/或重組父母形成了下一代的種羣,並且該過程再次開始,直到達到一些期望的質量或質量水平。在神經進化的情況下,個體是神經網絡,其通過隨機改變權重而突變(而在經典神經網絡中,權重根據非常精確的數學規則進行更新),或者甚至改變它們的拓撲結構,並且個人素質取決於他們在訓練數據上表現如何。
對不起,這裏沒有很難科學的參考,但也許這仍然有助於清理一些東西。
感謝您的回答,但主要問題是關於進化算法進行分類,以強化學習中一個可靠的參考 –
我不同意。 RL需要通過各種狀態和行爲的順序與環境進行交互。進化算法不適合這種模式。 – danelliottster
強化學習[1]和演化計算[2]之間的主要區別在於,原始意義上的RL應用於環境中的代理,學習策略(也參見維基百科關於reinforcement learning的文章),而EC是一類搜索算法的更通用的術語,它使用「進化」啓發式方法來優化搜索。我不會將EC歸類爲機器學習,我還沒有找到一個可以做到的機會。
[1]強化學習:簡介 - RS薩頓,AG巴託 - 1998年 - 劍橋大學出版社
[2]什麼是進化計算? - DB Fogel - Spectrum,IEEE,2000
很好的答案,但我曾看過一所大學的演講,其中說ML方法之一是進化的。再加上在這裏看到:http://local.wasp.uwa.edu.au/~derek/files/ncca/talks/ecg/research/html/ec.html它說:「有些作者歸類EC爲特定類型的ML的」 ,我們需要的是有一定的參考正是談論這個 –
順便[1]也提到,RL可以用來解決問題的規劃這是一種常見的使用進化計算的。 – danelliottster
那麼,進化計算在哪裏呢?這是一種強化學習的方法嗎?或者是一個單獨的機器學習方法?或者可能沒有?
我認爲EC和ML爲彼此不同。然而,有一些偉大的應用程序在那裏聯合使用。雖然這已經是相當長一段時間的研究的一小部分,但我覺得在EC和ML結合的領域有一些低下的成果。我認爲很多人都沒有耐心去看這些想法。
更新2017年:答案是肯定的。該most downloaded paper over the past month in Reinforcement Learning,恰當地命名爲「進化策略作爲一個可擴展的替代強化學習」確實是街談巷議的話題。
- 1. 強化學習
- 2. 何時使用某種強化學習算法?
- 3. 強化學習 - 從餘暉TD學習
- 4. C++強化學習庫
- 5. 強化學習俄羅斯方塊
- 6. 什麼是ph代表強化學習
- 7. 四連桿遊戲強化學習的最佳算法
- 8. 爲強化學習算法提供高效數據供給
- 9. 學習算法的方法
- 10. 強化學習的良好實現?
- 11. 分層強化學習的實現
- 12. 強化學習方法連續映射到
- 13. 可以強化學習代理學習離散分佈
- 14. 強化學習 - 從原始像素學習
- 15. 強化學習玩具項目
- 16. Java迷宮解決和強化學習
- 17. Pybrain強化學習;維狀態
- 18. 強化學習與變量行動
- 19. 初始化方法是Ruby中的一種內置方法嗎?
- 20. 這個簡單優化的機器學習算法是什麼?
- 21. 有沒有某種方法來強化數學函數?
- 22. 帶強化學習的多標準優化
- 23. 用於python強化學習的模擬和可視化庫?
- 24. Pari/GP中有一種合理化十進制的方法嗎?
- 25. 是否有任何積極的強化學習比賽?
- 26. 強化學習 - 根據得分優化權重
- 27. 神經網絡或任何其他監督學習算法可以學習特殊的統計方法嗎?
- 28. 基於相鄰值進行有效向量化計算的習慣性方法?
- 29. 關於機器學習,統計學習算法
- 30. 這是一種在JavaScript中實例化類的方法嗎?
這是最好的答案,但我會繼續搜索...感謝您的偉大答案! –