2012-03-09 25 views
-2

我有一個相當簡單的垃圾郵件過濾機制,它使用可能來自垃圾郵件(我使用這些郵件內容以及用戶配置文件字段等)的頑皮單詞列表。頑皮的單詞列表有助於打擊垃圾郵件嗎?

我目前有:

array ('shop','bags','shoes','shag','watches','sales','health','insurance','trader','wedding','casino','hack','ps3','cheap','episode','accessories','movie','nobod.info') 

您正在使用什麼表?我一直在添加/改變單詞,所以看到其他列表可能會有很大的幫助!

+3

這裏有一些體面的閱讀材料給你:http://www.codinghorror.com/blog/2007/12/blacklists-dont-work.html – 2012-03-09 22:11:03

回答

3

黑名單這樣的字將無法有效工作。機器學習技術在這裏非常有用。也就是說,查看明確標記爲垃圾郵件的郵件,並讓計算機瞭解垃圾郵件的真實外觀。這就是gmail等郵件網站用來對付垃圾郵件。這是很多工作,但一個非常可靠的方式來打擊垃圾郵件(當你最後一次看到垃圾郵件在你的Gmail郵箱?)

黑名單這樣的詞也有很高的誤報率,這將是很煩人。

+0

確實有一些誤報,但管理員可以否決這個很快。該消息只有在有人有權這樣做後才被隱藏。確實令人討厭,但目前不是一場災難。 – 2012-03-09 22:19:37