0

好的,我基本理解MCTS如何與節點選擇等一起工作。我不明白的是隨機轉出階段。 我是隨機模擬未來的遊戲步驟,直到它以贏或者輸的方式結束是否正確? 推出更多複雜的遊戲,其中包含許多國家和可能的行動以及未知的敵方行動,是否會持續很長時間? 如果隨機展開敵方移動直到遊戲結束,是不是隻是隨機返回贏或輸失敗? 如果有人能夠像3或4步遊戲這樣的簡單例子來解釋推出階段,我會很高興。如何在複雜遊戲中的MCTS中執行轉出

在此先感謝。

+0

哦,我看到有這樣的遊戲,其中一方只能防止損失,另一方不能失去。返回一個隨機丟失將返回一個不可能的結局。感謝那。 – user1090755

回答

4

模擬隨機遊戲比隨機返回贏得或失敗更具信息性。

想象一下TicTacToe板,其中一種顏色不能再贏,但另一種顏色可以。顯然,隨機推出可以揭示這一事實。

此外,樣本返回某個結果的概率通常有實際的信息。在所有隨機遊戲中贏得90%的情況可能比僅贏得所有隨機遊戲的10%的情況更可取。當然,這不能一概而論。一個分支只有在播放單個正確響應時纔可能包含某個獲勝 - 而且這個分支可能具有許多可能的失敗路徑。

MCTS的一個可能的改進是做比隨機播放更聰明。

相關問題