回答

12

有些明確的目標是解決強化學習問題的進化方法。該子領域通常以學習分類器系統(LCS)的名稱或偶爾以遺傳學機器學習(GBML)爲名。

除此之外,我不確定你的問題有一個非常明確的答案。它基本歸結爲「什麼是機器學習?」我們都沒有就如何回答這個問題達成一致。對於某些人來說,EC可能是該子域的一部分。對於其他人而言,並非如此。我剛從我的書架上抽取了幾本ML教科書,其中大約一半載有進化方法的資料。我懷疑15年前,這個比例會更高,但時尚會發生變化,機器學習現在幾乎是統計學的一個子領域。 EC方法不適合該模具。

+0

這是最好的答案,但我會繼續搜索...感謝您的偉大答案! –

5

進化計算或進化算法是優化算法,它應用於神經網絡(如神經進化)當然可以歸類爲強化學習的一種形式,雖然它的工作原理與通常的不同強化學習算法。

一般來說,在進化算法如遺傳算法或進化策略中,你有一個完整的個體需要優化。對於每一個人來說,一個質量函數被用來確定他們的「適應性」(就像'適者生存'一樣),而最好的個體被選爲下一代。那些'父母'然後被隨機地複製,修改,變異或甚至相互重組 - 這些完成的方式在每種不同的算法中都有所不同。最後,這些新的突變和/或重組父母形成了下一代的種羣,並且該過程再次開始,直到達到一些期望的質量或質量水平。在神經進化的情況下,個體是神經網絡,其通過隨機改變權重而突變(而在經典神經網絡中,權重根據非常精確的數學規則進行更新),或者甚至改變它們的拓撲結構,並且個人素質取決於他們在訓練數據上表現如何。

對不起,這裏沒有很難科學的參考,但也許這仍然有助於清理一些東西。

+0

感謝您的回答,但主要問題是關於進化算法進行分類,以強化學習中一個可靠的參考 –

+1

我不同意。 RL需要通過各種狀態和行爲的順序與環境進行交互。進化算法不適合這種模式。 – danelliottster

5

強化學習[1]和演化計算[2]之間的主要區別在於,原始意義上的RL應用於環境中的代理,學習策略(也參見維基百科關於reinforcement learning的文章),而EC是一類搜索算法的更通用的術語,它使用「進化」啓發式方法來優化搜索。我不會將EC歸類爲機器學習,我還沒有找到一個可以做到的機會。

[1]強化學習:簡介 - RS薩頓,AG巴託 - 1998年 - 劍橋大學出版社

[2]什麼是進化計算? - DB Fogel - Spectrum,IEEE,2000

+0

很好的答案,但我曾看過一所大學的演講,其中說ML方法之一是進化的。再加上在這裏看到:http://local.wasp.uwa.edu.au/~derek/files/ncca/talks/ecg/research/html/ec.html它說:「有些作者歸類EC爲特定類型的ML的」 ,我們需要的是有一定的參考正是談論這個 –

+0

順便[1]也提到,RL可以用來解決問題的規劃這是一種常見的使用進化計算的。 – danelliottster

0

那麼,進化計算在哪裏呢?這是一種強化學習的方法嗎?或者是一個單獨的機器學習方法?或者可能沒有?

我認爲EC和ML爲彼此不同。然而,有一些偉大的應用程序在那裏聯合使用。雖然這已經是相當長一段時間的研究的一小部分,但我覺得在EC和ML結合的領域有一些低下的成果。我認爲很多人都沒有耐心去看這些想法。