2014-03-06 34 views
0

我正在開發針對android的垃圾郵件檢測應用程序,我使用貝葉斯分類來檢測垃圾郵件。我想知道的是,我是否應該使用50個火腿消息和50個垃圾消息的訓練集,還是我應該進行基於用戶的內容培訓?它會對應用程序的有效性產生什麼影響?我知道這可能是一個廣泛的討論,但我想要一個確切的答案,而不是在這裏討論。Android垃圾郵件檢測應用程序?

回答

1

看起來您需要上千條培訓信息。

請注意,垃圾郵件發送者已經發現了通過這種過濾器的方法,例如, misagllings like「v1agra」。分類器的迭代改進可能趕上他們目前的技術。

Bayesian_spam_filtering看起來是一個很好的開始,特別是,其參考文獻的深入。