的有效方式我有一個像巨大的字符串:蟒蛇 - 檢查字符串的一部分是在列表
睡鼠的故事。曾幾何時,有三個小姐姐;他們的名字是Elsie,Lacie和Tillie;和他們住在 的好.... BADWORD底部...
和我有大約400個不好的話列表:
bad_words = ["badword", "badword1", ....]
什麼是檢查最有效的方法如果文本包含badwords列表中的壞詞?
我可以遍歷文本和列表,如:
for word in huge_string:
for bw in bad_words_list:
if bw in word:
# print "bad word is inside text"...
但這似乎我是從90年代..
更新:不好的話是單個單詞。
因此它可以是一個子或實際的話嗎?如果單詞使用集合。 –
@PadraicCunningham現在的實際單詞 – doniyor
您是否嘗試過'set intersection'? –