由於Django不處理過濾褻瀆 - 有沒有人有任何建議,以簡單的方式來實現某種自然語言處理/過濾褻瀆中的褻瀆?Django中的褻瀆評論
4
A
回答
7
Django的確處理過濾褻瀆。
從https://docs.djangoproject.com/en/1.4/ref/settings/#profanities-list:
PROFANITIES_LIST
默認值:()(空元組)
髒話的元組,作爲字符串,將在評論被禁止時
COMMENTS_ALLOW_PROFANITIES
是False
。
這就是說你仍然需要填充該列表。 Somelinkstogetstarted。我也會熟悉Scunthorpe problem。
2
我個人說...不要打擾。如果您創造更好的過濾器,他們會簡單地鍵入不同......
但是,這裏有一個簡單的例子:
import re
bad_words = ['spam', 'eggs']
# The \b gives a word boundary so you don't have the Scunthorpe problem: http://en.wikipedia.org/wiki/Scunthorpe_problem
pattern = re.compile(
r'\b(%s)\b' % '|'.join(bad_words),
re.IGNORECASE,
)
some_text = 'This text contains some profane words like spam and eggs. But it wont match spammy stuff.'
print some_text
# This text contains some profane words like spam and eggs. But it wont match spammy stuff.
clean_text = pattern.sub('XXX', some_text)
print clean_text
# This text contains some profane words like XXX and XXX. But it wont match spammy stuff.
+2
雅虎通過考慮科學學士學位的「BS」褻瀆和審查職位使自己看起來很愚蠢。除非你要做足夠的NLP來理解上下文,否則確保你的褻瀆清單是明確的。 – Dave
相關問題
- 1. solr中的褻瀆filteration
- 2. 褻瀆過濾器 - Java的
- 3. 褻瀆篩選的Lua
- 4. 褻瀆過濾器導入
- 5. PHP褻瀆濾波器的實現
- 6. 促銷代碼的褻瀆檢查
- 7. 的Javascript褻瀆比賽不能代替
- 8. 爲褻瀆過濾器優化代碼
- 9. 如何防止用戶輸入褻瀆?
- 10. 褻瀆過濾器不工作(PHP)
- 11. 西班牙語褻瀆黑名單
- 12. 不止一個軀體褻瀆?
- 13. 替換字符串中的褻瀆詞的正則表達式
- 14. Java中的我的褻瀆過濾器有什麼問題?
- 15. 解析Python/json褻瀆過濾器中的整個術語
- 16. 目標C中的基本褻瀆濾鏡iPhone
- 17. 如何過濾數字ID中的褻瀆詞?
- 18. Django評論
- 19. 如何使用Django的評論框架評論評論
- 20. 從谷歌語音識別中刪除褻瀆審查
- 21. 如何在C中添加一個褻瀆過濾器#
- 22. 如何在RoR中實現褻瀆濾鏡?
- 23. Disqus評論評論內Django管理
- 24. 需要檢查用戶輸入的褻瀆詞的句子
- 25. 簡單的PHP褻瀆過濾器的問題
- 26. 如何檢查用戶名對FireBase數據快照的褻瀆
- 27. 正則表達式的問題 - 褻瀆過濾器
- 28. 任何開源/免費的.NET褻瀆過濾網站?
- 29. 在Django中寫評論
- 30. Django GetStream和Django評論
注:自1.3它已經提到,PROFANITIES_LIST應該被棄用。我相信Adrian Holovaty和Daniel Greenberg在最近的談話中都提到這個計劃是1.5。它現在仍然在master分支,但我認爲(希望)它即將消失。 –
+1是的,我個人認爲有一個褻瀆名單是浪費時間,但正在糾正這個問題,因爲Django確實有基本的處理。以下是有關將內置列表更改爲空的發行說明的鏈接 - https://docs.djangoproject.com/en/1.4/releases/1.3/#no-more-naughty-words – zackdever
+1對於Scunthorpe問題。 @Tom我相信什麼是不贊成的列表內容 - 因爲你看它現在默認爲一個空的元組,但過去只用四個相當隨機的侮辱填充。 –