我有一些代碼工作正常刪除標點符號/數字在Python中使用正則表達式,我不得不改變代碼有點,所以停止列表工作,並不特別重要。無論如何,現在這個標點符號並沒有被刪除,坦率地說,我很難理解爲什麼。刪除標點符號/數字從文本問題
import re
import nltk
# Quran subset
filename = raw_input('Enter name of file to convert to ARFF with extension, eg. name.txt: ')
# create list of lower case words
word_list = re.split('\s+', file(filename).read().lower())
print 'Words in text:', len(word_list)
# punctuation and numbers to be removed
punctuation = re.compile(r'[-.?!,":;()|0-9]')
for word in word_list:
word = punctuation.sub("", word)
print word_list
爲什麼它不工作將是巨大的任何指針,我在Python中沒有專家,所以它可能是一些可笑的愚蠢。謝謝。