好的,我承認 - 這是一個糟糕的問題。 )但是,因爲我真的需要一些洞察力,如果你可以等到某種靈魂首先回答它。理解Tensorflow RNN中的數據集問題教程
我已經安裝併成功運行了RNN教程。我對此非常感興趣 - 儘管我對代碼有很好的感覺。不幸的是,the TensorFlow RNN tutorial沒有定義(至少對我來說),以瞭解需要幾個關鍵項目:
有什麼訓練和驗證集之間的邏輯區別?具體地,在在 'ptb.train.txt' 和 'ptb.valid.txt'
例如文件內容條款,ptb.train.txt包含:
there is no asbestos in our products now
然而,無論是
asbestos
也不in our products
出現在ptb.valid.txt
中,因此尚不清楚正在訓練什麼以及正在驗證的內容。我的'測試困惑'報告爲121.236。這是什麼意思?再一次,我真的很想知道'ptb.test.txt'文件 - 這是對什麼來衡量?
另一個典型例子:
ptb.test.txt
包含:the offers were to work as a writer not an editor
無論這個「序列」,也不是接近子集出現在任一
ptb.train.txt
或ptb.valid.txt
文件。也許我完全不在基地,但我認爲其意圖是匹配這樣的序列。這是不正確的?報告的困惑與此有何關係?最後(再次NOOB在這裏),即使是這個簡單的例子也需要很長時間才能訓練。有沒有辦法保存'訓練好的'系統,以便我可以針對不同的測試數據集運行它?
更新 我相信問題#3是answered in this SO question
確定downvoted ... – fabrizioM