2017-10-06 338 views
0

我正在訓練一個自定義命名實體識別(NER)模型中使用NeuroNER這是使用張量flow.I寫我能夠訓練模型及其表現良好,但是當我重新訓練它新的觀察,它顯示不正確的結果它糾正它們,但其影響/遺忘一些以前的觀察它顯示正確的結果。重新訓練tensorflow模型

我想在線再訓練。我嘗試使用stanfordNLP,Spacy,現在tensor-flow.please提出了一個更好的方法來達到預期的目標。

謝謝

回答

1

我覺得這個問題背後有一個誤解。當你訓練模型時,你調整了一組參數,有時甚至達到數百萬個參數。然後你的模型將學習如何適合這些數據。

神經網絡的事情是他們可能會忘記。這聽起來很糟糕,但實際上它使它變得非常強大:它學會忘記什麼是無用的。

也就是說,如果你再培訓你應該: - 只運行了幾個時代,否則模型會過度擬合新的數據集從而忘記了一切 - 學會在更大的數據集,即過去的+新數據,將確保沒有什麼東西被遺忘 - 可能會使用更大的設置(隱藏層大小或層數),因爲您無法無限期地希望通過相同的設置瞭解更多信息。

我不是在線培訓專家,但這不是您可以毫不費力地期望的。實際上很難做到。當你「繼續」訓練時,這遠非默認行爲。

希望它有幫助。

+0

感謝您的回覆。我會嘗試這種方法。 –