在一個紙牌遊戲中有兩個玩家,每個玩家發行5張牌(標準52牌組),然後一些任意功能決定勝出玩家。目標是預測遊戲的結果,給出每個玩家持有的5張牌。訓練數據可以是這個樣子:訓練一個神經網絡來預測紙牌遊戲的贏家
Player A Player B Winner
AsKs5d3h2d JcJd8d7h6s 1
7h5d8s9sTh 2c3c4cAhAs 0
6d6s6h6cQd AsKsQsJsTs 0
當「球員」列是5手牌,以及「勝者」列1
當玩家A贏了,並0
當玩家A已經丟失。
應該有朝向手的順序無差異,使得訓練後,供給網絡鏡像等輸入數據:
Player A Player B
2d3d6h7s9s TsTdJsQc3h
和
Player A Player B
TsTdJsQc3h 2d3d6h7s9s
將總是預測相反的結果。
這也應該是無所謂的手本身內的牌的順序,這樣AsKsQsJsTs
相同JsTsAsKsQs
,這是一樣的JsQsTsAsKs
等
什麼是一些合理的方法來構建一個神經網及其培訓數據來解決這個問題?
ooc爲什麼你覺得神經網絡是解決這個監督學習問題最合適的結構?你有沒有用NN的類似問題? – javadba