2010-09-05 64 views
5

我正在尋找在我設定的時間間隔內對我的數據庫進行搜索以查看我認爲令人反感的詞語的列表(因爲我是獨裁獨裁者,我討厭言論自由 - 我用鐵拳統治)。搜索數據庫中的冒犯性詞語

如何最有效地搜索我的數據庫中的關鍵字列表?我打算搜索的兩列索引爲全文。

如果有人知道一個有用的冒犯性詞彙列表。

的說明那些誰在審查

我將擁有兩個系統嘲笑我的嘗試。首先是管理員每天檢查的報告功能。打擊異議者的第二個工具就是這個。所有它需要的是一個單詞搜索,以便管理員可以檢查並判斷內容是否令人反感。

+2

它可能值得注意的是,這是一個真正的問題 - 所有的笑話都放在一邊。 – Starlin 2010-09-05 18:24:28

+2

這是一個困難問題。 – Skilldrick 2010-09-05 18:36:46

+0

「我將如何最有效地搜索我的數據庫以獲取關鍵字列表?」對不起 - 您有單詞列表,並希望查找現有數據中的實例,或使用搜索來創建要審查的單詞列表? – 2010-09-05 18:38:16

回答

2

MySQL不會給你工具的acurate的搜索,藉此樣本,如果你有你的話中:

自由

既然你是一個獨裁者,你不它不應該出現,但它應該出現,但聰明的用戶會把fr33dom,這是相同的,現在你有3種方法來點這個:

  1. 你放在你的列表中的一個字和 最推導,你可以想像
  2. 你讓一個LIKE搜索在你的MySQL查詢,但它應該是sloow當你到了成千上萬,甚至全文索引
  3. 你指數的使用Lucene
  4. 內容

因爲Lucene是執行搜索的最佳選擇,所以我會去第三個,既然你正在尋找單詞,我可以想象你正在處理文本,所以這可能比你想象的更有幫助。 Lucene可以幫助你搜索類似於自由的單詞,但不是它,你不應該錯過!你的規則是有保證的!

有一些使用Zend Framework的Lucene擴展,你可以在Google中輕鬆找到它們。

祝你在獨裁時刻好運!

+0

Lucene看起來很難...我應該注意到我正在尋找一個快速解決方案...旨在作爲我的應用程序啓動的臨時解決方案。我想我贊成第一個解決方案。第二個可能會造成很多誤報。 – Starlin 2010-09-05 19:00:50

+0

另外請注意,您的努力將獲得豐厚的獎勵。我永遠不會忘記那些支持我的人。 – Starlin 2010-09-05 19:04:44

+0

謝謝你的恩典,我的主!哈哈哈。我希望我能幫助! – 2010-09-05 19:25:23

1

這裏是你的盯着名單! http://onlineslangdictionary.com/lists/most-vulgar-words/ 查看網站了解更多

想法:DB他們的名單,然後屏幕對你的數據庫。 或者,DB將它們的列表,全部創建爲關鍵詞,阻止條目。 然後,在文字中使用SQL通配符來檢查:自由還是Fr ** dom,

但是tech1派生的問題是無限的。

+0

如果你至少可以阻止Cl ** eland St ** mer你應該清楚。 – ChaosPandion 2010-09-05 19:25:09

+0

這些大多數似乎是短語而不是文字,而且是相當有意思的短語。 – Hammerite 2010-09-05 23:04:14

0

下面的鏈接會列出12種語言的2200個錯誤詞彙。 MySQL轉儲,JSON,XML或CSV選項可用。

https://github.com/turalus/openDB

執行這個轉存到自己的數據庫,然後查詢任何發生。

+0

請不要將[相同的答案添加到多個問題](http://meta.stackexchange.com/questions/104227/is-it-acceptable-to-add-a-duplicate-answer-to-several-questions )。一旦你獲得了足夠的聲望,請回答最好的一個,並將其餘標記爲重複。如果它不是重複的,請調整問題的位置並標記爲未刪除。 – 2017-03-03 09:41:39