0
https://github.com/yenchenlin/DeepLearningFlappyBird/blob/master/deep_q_network.py#L82無法理解這樣的線流行的深Q學習計劃
我花了很多時間來了解它。
爲什麼使用tf.multiply
?
我找不到支持此乘法運算的數學運算。
https://github.com/yenchenlin/DeepLearningFlappyBird/blob/master/deep_q_network.py#L82無法理解這樣的線流行的深Q學習計劃
我花了很多時間來了解它。
爲什麼使用tf.multiply
?
我找不到支持此乘法運算的數學運算。
每個動作都有一個Q_value。
而動作輸入a
是一個熱門。
所以這一行是選擇'熱'Q_value。
我認爲這個問題更適合https://stats.stackexchange.com/。 – PJvG
@PJvG謝謝。 –