1
A
回答
1
在他的書中"Machine Learning" (1st ed.),湯姆•米切爾解釋了這一如下(參見1.2.1節,第5頁):
例如,在學習演奏checkers時,系統可能會從直接獲知由單個跳棋板狀態組成的訓練示例以及每個跳棋的正確動作。或者,它可能只提供間接信息,包括各種遊戲的移動順序和最終結果。在此後的情況下,遊戲早期的特定動作的正確性信息必須從遊戲最終獲勝或失敗這一事實間接推斷出來。
他進一步指出:
這裏[使用間接反饋]學習者面對信用分配,或確定所述序列中的每個移動值得稱讚或歸咎於程度的另外的問題最終的結果。信用分配可能是一個特別困難的問題,因爲即使早期的移動是最佳的,如果這些後面的移動不好,遊戲也會丟失。因此,從直接培訓反饋中學習通常比從間接反饋中學習更容易。
相關問題
- 1. 培訓神經網絡 -
- 2. 一類分類器培訓
- 3. 訓練字母圖像到全批培訓的神經網絡
- 4. svm.sparse.SVC花了很多時間去接受培訓
- 5. DBpedia中,得到了直接或間接的類型將
- 6. 培訓OpenNLP文檔分類
- 7. ANN - 人工神經網絡培訓
- 8. 減少cnn的培訓時間
- 9. tf.estimator的分佈式培訓導致更多的培訓步驟
- 10. Brain.js增加訓練初期培訓不完全再培訓我目前一個項目,它有一個去接受培訓的所有時刻使用Brain.js
- 11. 是網狀CompositeByteBuf直接或間接
- 12. 自然語言分類器返回未經培訓的項目的分類
- 13. TensorFlow培訓
- 14. JBoss Seam培訓
- 15. DNN CMS培訓
- 16. NLTK NaiveBayesClassifier培訓
- 17. Sharepoint培訓
- 18. 在線培訓
- 19. kNN:培訓,測試和驗證
- 20. Tensorflow培訓/驗證損失nan問題
- 21. 感知器培訓的三角洲培訓規則
- 22. 從類到其任何一個直接或間接基類的隱式轉換
- 23. 使用Encog正確地進行培訓和驗證
- 24. 培訓功能不能訓練我的分類
- 25. 通過Tensorflow進行培訓和預測
- 26. 在PHP中進行培訓註冊
- 27. Tensorflow Slim的批量培訓
- 28. iPhone上的Tesseract培訓
- 29. 培訓的Tesseract - shapeclustering問題
- 30. OpenCV的哈爾培訓
多少錢?快速的谷歌搜索顯示了大量的結果。 – tttthomasssss 2014-09-12 20:09:34
我只需要答案,爲什麼最大熵是有用的,我無法找到。因爲最大熵顯示更多的不純物質 – 2014-09-13 18:15:33