0
我試圖代碼霸氣
輸入一個神經網絡獲得最大的指數是8×8×3的矩陣我組織矩陣如下:
第一深度是遊戲的狀態,第二個深度是翻轉板和最後一個深度是玩家飛機
輸出是8 x 8是玩最好的遊戲aka移動學習(由蒙特卡羅樹搜索產生)火炬 - Lua中/從矩陣
然後網絡是一個8×8的張量,有可能成爲最好的遊戲, 我需要得到張量對我最大概率的指數(x,y)爲
我試着用torch.max(張量,2)和torch.max(張量?1)函數,但是我沒有得到我所需要的。
有人可以有任何線索幫助我嗎?
非常感謝!
#out = output of the neural net and output is the target output[indice][1]
# need to check if the target is the same as prediction
max, bestTarget = torch.max(output[index][1],2)
maxP, bestPrediction = torch.max(out,2)
max, indT = torch.max(max,1)
maxP, indP = torch.max(maxP,1)