2014-02-11 126 views
0

我有一個關於我的ANN的培訓和測試數據的問題。用於培訓和測試的神經網絡數據

測試數據是否應該在通過特徵提取過程進行分類之前進行? 我是這個領域的新手。我做的對嗎? 我將數據集分爲80%的訓練和20%的測試。兩套,我提取功能。對於列車數據,我把它放入訓練網絡,但不是用於測試數據。然後去分類。它是否正確?因爲我的SV說測試數據不應該經過特徵提取過程。我想知道如果沒有提取特定功能,ANN如何識別輸入。道歉我的壞英語。

如果任何人有聯繫或雜誌,我可以參考,請提供它..

非常感謝。

回答

0

培訓和測試數據都需要採用相同的格式 - 因此您的培訓數據和測試數據應該經過相同的預處理步驟,否則您的網絡將無法正確學習。

+0

謝謝Soaring_Lion ...你有任何期刊或論文,以便我可以閱讀嗎? – user2301196

0

你做得對(據我瞭解你的問題)。

例如:如果你要給我10個紙面上的圖像面(訓練數據)的,然後通過他們的名存實亡(不同的特徵表示)送給我2人(訓練數據) - 我不會能夠分類我沒有學到的東西。您無法使用圖像訓練網絡,然後使用音頻或除您用於訓練的其他任何表示以外的其他表示進行測試。我無法連接任何文件,因爲這只是常識。

可以修改訓練集,例如,通過增加噪音。但無論你做什麼,表示格式都必須相同。

+0

好的,感謝Malch的解釋。我希望我能說服我的SV。再次感謝。 – user2301196

+0

這可能是一個誤解。只要做一些對你有意義的事情。如果它起作用,它就會起作用。 – runDOSrun