對於ai類項目,我需要實現強化學習算法,該算法可以打敗俄羅斯方塊的簡單遊戲。遊戲是用Java編寫的,我們有源代碼。我知道強化學習理論的基礎知識,但想知道SO社區中的任何人是否有過這方面的經驗。強化學習的良好實現?
- 對於在俄羅斯方塊遊戲中實施強化學習,您的推薦讀物是什麼?
- 有沒有什麼好的開源項目能夠完成類似的事情,值得一試?
編輯:越具體越好,但有關該主題的一般資源受到歡迎。
追問:
認爲這將是很好,如果我發佈了隨訪。
下面是解決方案(代碼和寫作),我結束了爲未來的學生:)。
對於ai類項目,我需要實現強化學習算法,該算法可以打敗俄羅斯方塊的簡單遊戲。遊戲是用Java編寫的,我們有源代碼。我知道強化學習理論的基礎知識,但想知道SO社區中的任何人是否有過這方面的經驗。強化學習的良好實現?
編輯:越具體越好,但有關該主題的一般資源受到歡迎。
追問:
認爲這將是很好,如果我發佈了隨訪。
下面是解決方案(代碼和寫作),我結束了爲未來的學生:)。
看看在2009年RL-competition。其中一個問題域是tetris game。前一年也出現了俄羅斯方塊問題。這是來自當年的第五名決賽選手52-page final report,其中詳細介紹了代理人如何工作。
的Heaton Research電子書是在說明神經網絡的概念(有代碼)相當不錯。第4章致力於機器學習和網絡的各種培訓方法。有一個可下載的庫和示例應用程序供您查看。
這是一本好書,關於這個問題:
Machine Learning and Data Mining: Introduction to Principles and Algorithms
由Igor Kononenko,Matjaz Kukar(2007年6月)
而且看看這些開源項目:
TD-Gammon,gnubackgammon或任何其他類似的項目在遊戲中都取得了巨大的成功。
薩頓&巴託的書「強化學習:介紹」也有其他一些Case Studies。
這不是特定於強化學習,但斯坦福大學有一系列有關machine learning on Youtube和iTunes的系列講座。
鏈接是第一次講座,大約需要30分鐘才能進入內容。
Burlap是一個最新的Java庫,提供了許多常用強化學習算法的實現以及一些環境和有用的工具。
+1問一個好的功課問題。看到有人要求學習,而不是要求給予某些東西,這讓人耳目一新。 – 2009-04-13 22:13:48
絕對同意;要求良好的學習資源是一個很好的問題,它也有助於未來的其他人 – Sukasa 2009-05-28 22:04:32