強化學習的良好實現？

對於ai類項目，我需要實現強化學習算法，該算法可以打敗俄羅斯方塊的簡單遊戲。遊戲是用Java編寫的，我們有源代碼。我知道強化學習理論的基礎知識，但想知道SO社區中的任何人是否有過這方面的經驗。強化學習的良好實現？

編輯：越具體越好，但有關該主題的一般資源受到歡迎。

追問：

認爲這將是很好，如果我發佈了隨訪。

下面是解決方案（代碼和寫作），我結束了爲未來的學生:)。

2009-04-11 bdd

+1問一個好的功課問題。看到有人要求學習，而不是要求給予某些東西，這讓人耳目一新。 – 2009-04-13 22:13:48

絕對同意;要求良好的學習資源是一個很好的問題，它也有助於未來的其他人 – Sukasa 2009-05-28 22:04:32

看看在2009年RL-competition。其中一個問題域是tetris game。前一年也出現了俄羅斯方塊問題。這是來自當年的第五名決賽選手52-page final report，其中詳細介紹了代理人如何工作。

2009-04-13 02:32:22 andrewdotn

的Heaton Research電子書是在說明神經網絡的概念（有代碼）相當不錯。第4章致力於機器學習和網絡的各種培訓方法。有一個可下載的庫和示例應用程序供您查看。

2009-04-11 17:05:00 Codebrain

這是一本好書，關於這個問題：

而且看看這些開源項目：

2009-04-11 17:08:52

TD-Gammon，gnubackgammon或任何其他類似的項目在遊戲中都取得了巨大的成功。

薩頓&巴託的書「強化學習：介紹」也有其他一些Case Studies。

2009-08-25 06:21:51

這不是特定於強化學習，但斯坦福大學有一系列有關machine learning on Youtube和iTunes的系列講座。

鏈接是第一次講座，大約需要30分鐘才能進入內容。

2009-10-12 23:29:33 hannson

Burlap是一個最新的Java庫，提供了許多常用強化學習算法的實現以及一些環境和有用的工具。

2016-06-02 13:19:11

回答