monte-carlo-tree-search

1熱度

2回答

嘗試使用YouTube視頻和論文來學習MCST。 http://www0.cs.ucl.ac.uk/staff/D.Silver/web/Applications_files/grand-challenge.pdf 但是我沒有多少運氣的理解超越了高層次的理論解釋的細節。以下是上述論文中的一些引用以及我有的問題。選擇階段：MCTS反覆選擇當前狀態的得分最高的子節點。如果當前狀態是根節點，那麼這些孩

0熱度

1回答

蒙地卡羅樹搜索交替

任何人都可以請澄清如何（因爲我沒有在任何地方找到任何明確的例子）MCTS算法迭代爲第二個球員。我看起來似乎只是看起來像它正在播放，例如P1每次移動。我理解一個代理的步驟，但我從來沒有發現任何顯示P2放置其計數器的代碼的任何內容，這肯定在增長樹時必須發生。基本上我所期望的：每個ITER：選擇節點PLAYER1 擴大PLAYER1 選擇節點Player2 擴大玩家2 推出 backpropo

2熱度

1回答

蒙地卡羅樹搜索改進

我試圖在遊戲上實現MCTS算法。我每次只能使用大約0.33秒。在這個時候，我可以從每個孩子的起始狀態產生一到兩個遊戲，其中包含大約500個子節點。我的模擬不是隨機的，但當然我不能根據1或2模擬做出正確的選擇。在遊戲中，樹越來越小，我可以根據更多的模擬進行選擇。所以我的問題是在前幾個步驟。有沒有辦法改進MCTS算法，以便它可以模擬更多的遊戲，或者我應該使用其他算法？