任何人都可以請澄清如何(因爲我沒有在任何地方找到任何明確的例子)MCTS算法迭代爲第二個球員。蒙地卡羅樹搜索交替
我看起來似乎只是看起來像它正在播放,例如P1每次移動。 我理解一個代理的步驟,但我從來沒有發現任何顯示P2放置其計數器的代碼的任何內容,這肯定在增長樹時必須發生。
基本上我所期望的:
每個ITER:
選擇節點PLAYER1 擴大PLAYER1
選擇節點Player2 擴大玩家2
推出 backpropogate
下一個iter
這是對嗎?任何人都可以拼出一些顯示的僞碼嗎?無論迭代還是遞歸,我都不介意。
感謝您的任何幫助。
好的,謝謝你的額外建議,我會再考慮一下。 – progan01
我現在還不確定。我想迭代必須是這樣的: 每個ITER \t PLAYER1選擇 \t播放器1擴大 \t player2選擇 \t player2擴大 \t推出 \t backpropogate 未來ITER – progan01