2009-08-25 32 views
1

對於從孩子們採取輸入的網站,我們需要過濾他們在網站(運行PHP)中輸入他們的評論時使用的任何淘氣/壞字。黑名單上的內容來過濾郵件

評論是一個免費的字段,用戶可以輸入他們想要的任何評論。我能想到的解決方案是有一個像 BLACKLIST的單詞列表:壞,壞,字,woord,craap,craaaap,(我們可以填寫所有黑名單)。

然後,當表單被保存時,我們可以查看列表,如果有任何單詞存在,那麼我們將不允許保存評論。

但該方法的prolem的是,他們可以通過添加字母的話,使其跳過過濾器EG得到解決:shiiiiit

讓我知道你的想法是創建一些過濾器的最佳方式這些字。

+0

啊,clbuttic ... – MikeTheLiar 2013-01-31 22:25:59

回答

6

你永遠無法過濾每一個排列。也許最可行的解決方案是過濾顯而易見的,並實施「報告濫用」機制,以便有人可以手動查看(並拒絕)可疑評論。

5

因此,你會禁止狗屎,shït,shıt,śhit和śhiŧ?

黑名單在Unicode時代並不是一個可行的解決方案。然而,徹底禁止似乎過分。

-1

也總是有可能過濾像「低音」這樣的詞,當然包括不允許的單詞之一。目前一些優秀的主持人似乎是解決這個問題的最佳解決方案。

+0

更成問題的是「屁股」在某些情況下只是猥褻。在其他情況下,這是一種動物的名字。 – troelskn 2009-08-25 11:00:28

4

如果你有足夠的時間,值得閱讀關於Scunthorpe problem

Jeff Atwood在the futility of obscenity filters也有帖子。

+0

這是一些很好的閱讀,我特別喜歡最後一個:2008年6月,由美國家庭協會運行的一個新聞網站審查了美聯社關於短跑運動員泰森蓋伊的文章,用同性戀取代了「同性戀」的例子,從而使他的名字作爲「泰森同性戀」。 – 2009-08-25 10:10:47

0

使用uClassify來訓練不好的評論,當系統訓練得足夠好時,您可以標記出有問題的評論。