我創建了一個用於檢測垃圾郵件的神經網絡。 它涉及以下步驟;神經網絡訓練中的奇怪行爲?
1.Formation of tf-idf matrix of terms and mails.
2.Reduction of matrix using PCA.
3.Feeding the 20 most important terms according to eigen values to neural network as features.
我正在爲1-Spam和0-Not spam進行培訓。
EDITS: 我決定通過批量處理7封郵件來訓練它,因爲它在形成矩陣時容易出現內存不足錯誤。我使用了火腿和垃圾郵件的標準enron數據集。 我曾經通過後向傳播訓練神經網絡-1個輸入-1個隱藏-1個輸出層,第一層有20個神經元,有6個隱藏層神經元。
因此,我開始在我的gmail中使用我的原始垃圾郵件進行培訓,在將其切換到enron數據集之前給出了非常糟糕的結果。訓練相當多後,獲得滿意的結果。
當我測試時,14封郵件中有6封被發現垃圾郵件。
我使用了垃圾郵件第1批和火腿郵件第2批等替代培訓,以便網絡訓練1個垃圾郵件輸出和0個火腿。
但是現在經過太多的訓練後,我估計400-500封電子郵件,如果再次給出不好的結果。我減少了學習速度,但沒有幫助。 怎麼回事?
你在這裏沒有給我們太多的信息。 –
我編輯過。請告訴我,如果你需要一些具體的信息,我很困難。謝謝 – Hooli
對於數量較少的時代,它是否會給你預期的結果?如果是這樣,你的數據集是太小/偏見或網絡過度訓練:http://en.wikipedia.org/wiki/Overfitting –