monte-carlo-tree-search

    1熱度

    2回答

    嘗試使用YouTube視頻和論文來學習MCST。 http://www0.cs.ucl.ac.uk/staff/D.Silver/web/Applications_files/grand-challenge.pdf 但是我沒有多少運氣的理解超越了高層次的理論解釋的細節。以下是上述論文中的一些引用以及我有的問題。 選擇階段:MCTS反覆選擇當前狀態的得分最高的子節點。如果當前狀態是根節點,那麼這些孩

    0熱度

    1回答

    任何人都可以請澄清如何(因爲我沒有在任何地方找到任何明確的例子)MCTS算法迭代爲第二個球員。 我看起來似乎只是看起來像它正在播放,例如P1每次移動。 我理解一個代理的步驟,但我從來沒有發現任何顯示P2放置其計數器的代碼的任何內容,這肯定在增長樹時必須發生。 基本上我所期望的: 每個ITER: 選擇節點PLAYER1 擴大PLAYER1 選擇節點Player2 擴大玩家2 推出 backpropo

    2熱度

    1回答

    我試圖在遊戲上實現MCTS算法。我每次只能使用大約0.33秒。在這個時候,我可以從每個孩子的起始狀態產生一到兩個遊戲,其中包含大約500個子節點。我的模擬不是隨機的,但當然我不能根據1或2模擬做出正確的選擇。在遊戲中,樹越來越小,我可以根據更多的模擬進行選擇。 所以我的問題是在前幾個步驟。有沒有辦法改進MCTS算法,以便它可以模擬更多的遊戲,或者我應該使用其他算法?