我想解決一些分類問題。看來很多經典的方法都遵循類似的範例。也就是說,用一些訓練集訓練一個模型,並用它來預測新實例的類標籤。在機器學習中使用反饋或強化?
我想知道是否有可能在範式中引入一些反饋機制。在控制理論中,引入反饋迴路是提高系統性能的有效方法。我現在頭腦中一個簡單的方法是,首先我們先從一組初始實例開始,然後用它們訓練一個模型。然後,每當模型做出錯誤的預測時,我們將錯誤的實例添加到訓練集中。這不同於盲目放大訓練集,因爲它更具針對性。這可以看作是控制理論語言中的某種負反饋。
有沒有對反饋方法進行研究?任何人都可以點亮一下嗎?
仰望提升,這基本上是你所描述的。 –
是否應該遷移到http://stats.stackexchange.com/? – sashkello
smwikipedia:我在完全相同的問題。 http://stackoverflow.com/questions/36068292/incorporating-user-feedback-in-a-ml-model。你想分享你的發現嗎? –