進化計算是一種強化學習的方法嗎？

什麼是進化計算？這是一種強化學習的方法嗎？或者是一個單獨的機器學習方法？或者可能沒有？進化計算是一種強化學習的方法嗎？

請引用用於回答此問題的參考。

2012-09-13 Arin Aivazian

有些明確的目標是解決強化學習問題的進化方法。該子領域通常以學習分類器系統（LCS）的名稱或偶爾以遺傳學機器學習（GBML）爲名。

除此之外，我不確定你的問題有一個非常明確的答案。它基本歸結爲「什麼是機器學習？」我們都沒有就如何回答這個問題達成一致。對於某些人來說，EC可能是該子域的一部分。對於其他人而言，並非如此。我剛從我的書架上抽取了幾本ML教科書，其中大約一半載有進化方法的資料。我懷疑15年前，這個比例會更高，但時尚會發生變化，機器學習現在幾乎是統計學的一個子領域。 EC方法不適合該模具。

來源

2012-10-08 16:02:32 deong

這是最好的答案，但我會繼續搜索...感謝您的偉大答案！ –

進化計算或進化算法是優化算法，它應用於神經網絡（如神經進化）當然可以歸類爲強化學習的一種形式，雖然它的工作原理與通常的不同強化學習算法。

一般來說，在進化算法如遺傳算法或進化策略中，你有一個完整的個體需要優化。對於每一個人來說，一個質量函數被用來確定他們的「適應性」（就像'適者生存'一樣），而最好的個體被選爲下一代。那些'父母'然後被隨機地複製，修改，變異或甚至相互重組 - 這些完成的方式在每種不同的算法中都有所不同。最後，這些新的突變和/或重組父母形成了下一代的種羣，並且該過程再次開始，直到達到一些期望的質量或質量水平。在神經進化的情況下，個體是神經網絡，其通過隨機改變權重而突變（而在經典神經網絡中，權重根據非常精確的數學規則進行更新），或者甚至改變它們的拓撲結構，並且個人素質取決於他們在訓練數據上表現如何。

對不起，這裏沒有很難科學的參考，但也許這仍然有助於清理一些東西。

來源

2012-09-13 19:24:31

感謝您的回答，但主要問題是關於進化算法進行分類，以強化學習中一個可靠的參考 –

我不同意。 RL需要通過各種狀態和行爲的順序與環境進行交互。進化算法不適合這種模式。 – danelliottster

強化學習[1]和演化計算[2]之間的主要區別在於，原始意義上的RL應用於環境中的代理，學習策略（也參見維基百科關於reinforcement learning的文章），而EC是一類搜索算法的更通用的術語，它使用「進化」啓發式方法來優化搜索。我不會將EC歸類爲機器學習，我還沒有找到一個可以做到的機會。

[1]強化學習：簡介 - RS薩頓，AG巴託 - 1998年 - 劍橋大學出版社

[2]什麼是進化計算？ - DB Fogel - Spectrum，IEEE，2000

來源

2012-09-14 15:57:45 Jakob

很好的答案，但我曾看過一所大學的演講，其中說ML方法之一是進化的。再加上在這裏看到：http://local.wasp.uwa.edu.au/~derek/files/ncca/talks/ecg/research/html/ec.html它說：「有些作者歸類EC爲特定類型的ML的」，我們需要的是有一定的參考正是談論這個 –

順便[1]也提到，RL可以用來解決問題的規劃這是一種常見的使用進化計算的。 – danelliottster

那麼，進化計算在哪裏呢？這是一種強化學習的方法嗎？或者是一個單獨的機器學習方法？或者可能沒有？

我認爲EC和ML爲彼此不同。然而，有一些偉大的應用程序在那裏聯合使用。雖然這已經是相當長一段時間的研究的一小部分，但我覺得在EC和ML結合的領域有一些低下的成果。我認爲很多人都沒有耐心去看這些想法。

來源

2013-03-12 13:31:42 danelliottster

更新2017年：答案是肯定的。該most downloaded paper over the past month in Reinforcement Learning，恰當地命名爲「進化策略作爲一個可擴展的替代強化學習」確實是街談巷議的話題。

來源

2017-04-27 15:06:01 Rhubarb

進化計算是一種強化學習的方法嗎？

回答

相關問題