0
我需要閱讀字符串列表並刪除一些特殊字符。我編寫的代碼可行,但我正在尋找一種有效編寫代碼的方法。因爲我需要爲100萬長列表(例如每個列表有100000個單詞)執行此過程。找到並從python中的長字符串列表中刪除一些子字符串
我寫了一個例子來清除我的問題。
input:
str= ['short', 'club', 'edit', 'post\C2', 'le\C3', 'lundi', 'janvier', '2008']
specialSubString=['\C2','\C3','\E2']
output:
str= ['short', 'club', 'edit', 'post', 'le', 'lundi', 'janvier', '2008']
我的代碼:
ml=len(str)
for w in range(0,ml):
for i in range(0, len(specialSubString)):
token=specialSubString[i]
if token not in str[w]:
continue
else:
l= len(token)
t= str[w]
end= len(t)-l
str[w]=t[:end]
break
for w in str:
print w