我試圖實現與α-β剪枝在Java中的跳棋遊戲極小。我的minimax算法完美運作。我的代碼與alpha-beta代碼一起運行。不幸的是,當我玩標準極小極小算法的1000場比賽時,alpha-beta算法總是落後50場左右。的Java極小α-β剪枝遞歸返回
由於α-β修剪不應該降低動作的質量,就需要實現它們的時候,有些事情是錯誤的。但是,我已經拿出筆和紙,繪製假設的葉節點值,並使用我的算法來預測它是否會計算正確的最佳移動,並且看起來沒有任何邏輯錯誤。我使用了這個視頻中的樹:Alpha-Beta Pruning來跟蹤我的算法。它邏輯上應該做出所有相同的選擇,因此是一個有效的實現。
我也把打印語句插入代碼(它們已被刪除,以減少雜波),並正在返回的值正確出現的修剪確實會發生。儘管我盡了最大的努力,但我一直無法找到邏輯錯誤所在。這是我實施這個的第三個不同嘗試,他們都有同樣的問題。
我不能在這裏發佈完整的代碼,它是太長,所以我已經包括相關的錯誤的方法。我不確定,但我懷疑這個問題很可能在非遞歸move()方法中,儘管我無法找到它的邏輯錯誤,所以我只會更多地在其中進行顛簸,可能會使事情沒有韻律或原因,更糟糕而不是更好。
有一招,在for循環回收來自遞歸調用多個整數值?它適用於我的minimax和negamax實現,但alpha-beta修剪似乎產生了一些奇怪的結果。
@Override
public GameState move(GameState state)
{
int alpha = -INFINITY;
int beta = INFINITY;
int bestScore = -Integer.MAX_VALUE;
GameTreeNode gameTreeRoot = new GameTreeNode(state);
GameState bestMove = null;
for(GameTreeNode child: gameTreeRoot.getChildren())
{
if(bestMove == null)
{
bestMove = child.getState();
}
alpha = Math.max(alpha, miniMax(child, plyDepth - 1, alpha, beta));
if(alpha > bestScore)
{
bestMove = child.getState();
bestScore = alpha;
}
}
return bestMove;
}
private int miniMax(GameTreeNode currentNode, int depth, int alpha, int beta)
{
if(depth <= 0 || terminalNode(currentNode.getState()))
{
return getHeuristic(currentNode.getState());
}
if(currentNode.getState().getCurrentPlayer().equals(selfColor))
{
for(GameTreeNode child: currentNode.getChildren())
{
alpha = Math.max(alpha, miniMax(child, depth - 1, alpha, beta));
if(alpha >= beta)
{
return beta;
}
}
return alpha;
}
else
{
for(GameTreeNode child: currentNode.getChildren())
{
beta = Math.min(beta, miniMax(child, depth - 1, alpha, beta));
if(alpha >= beta)
{
return alpha;
}
}
return beta;
}
}
//Checks to see if the node is terminal
private boolean terminalNode(GameState state)
{
if(state.getStatus().equals(win) || state.getStatus().equals(lose) || state.getStatus().equals(draw))
{
return true;
}
else
{
return false;
}
}
跳棋有一個標準的起始位置,並且alpha-beta修剪的minimax和minimax都是確定性算法,因此除非您在某處引入了隨機性,否則每個遊戲都應該完全相同。也許這種隨機性導致了結果的分歧。 – 2013-03-17 22:43:38
帶有alpha-beta的Minimax和minimax通過definintion應該產生相同的結果,只有alpha-beta修剪會讓你的結果稍微快一些,「有點」取決於你的移動排序是否有效。因此,測試您的alpha-beta實現的方式是在一大組位置上運行minimax,並驗證兩個版本的相同結果。 – 2013-03-17 22:46:41
@Kyle我意識到這實際上是因爲我的極大極小算法從相同的最佳移動中返回一個隨機移動,而我的alpha-beta修剪算法只返回考慮的第一個最佳移動(因爲alpha通過的方式實現了無法找到的移動)。在開始的時候,移動到第3層時,板的分數相同,但實際上更糟糕,但它是alpha-beta修剪考慮的第一個,因此被返回。所以在這種情況下,從最好的移動中選擇一個隨機移動比選擇第一個移動要好。謝謝您的幫助。 – sage88 2013-03-24 05:07:03