2014-09-12 25 views
1

我有一個問題,直接或間接的各類培訓的先進經驗

在機器學習,我們定義兩個類型的培訓經歷類型:

直接和間接。

我搜索了很多關於差異,但我找不到。有人熟悉這些嗎?

預先感謝您

+0

多少錢?快速的谷歌搜索顯示了大量的結果。 – tttthomasssss 2014-09-12 20:09:34

+0

我只需要答案,爲什麼最大熵是有用的,我無法找到。因爲最大熵顯示更多的不純物質 – 2014-09-13 18:15:33

回答

1

在他的書中"Machine Learning" (1st ed.),湯姆•米切爾解釋了這一如下(參見1.2.1節,第5頁):

例如,在學習演奏checkers時,系統可能會從直接獲知由單個跳棋板狀態組成的訓練示例以及每個跳棋的正確動作。或者,它可能只提供間接信息,包括各種遊戲的移動順序和最終結果。在此後的情況下,遊戲早期的特定動作的正確性信息必須從遊戲最終獲勝或失敗這一事實間接推斷出來。

他進一步指出:

這裏[使用間接反饋]學習者面對信用分配,或確定所述序列中的每個移動值得稱讚或歸咎於程度的另外的問題最終的結果。信用分配可能是一個特別困難的問題,因爲即使早期的移動是最佳的,如果這些後面的移動不好,遊戲也會丟失。因此,從直接培訓反饋中學習通常比從間接反饋中學習更容易。