在python中有一點困難。我想帶一個帶有許多評論的.txt文件並將它分成一個列表。但是,我想分割所有標點符號,空格和\ n。當我運行下面的python代碼時,它將我的文本文件分裂成多個奇怪的點。 注意:下面我只是試圖在期間和期限上進行分割來測試它。但它仍然經常用文字去掉最後一封信。Python中的`re.split()`奇怪地工作
import regex as re
with open('G:/My Documents/AHRQUnstructuredComments2.txt','r') as infile:
nf = infile.read()
wList = re.split('. | \n, nf)
print(wList)
您忘記了正則表達式字符串的結束語。 –
看看這篇文章是否有幫助https://stackoverflow.com/questions/4998629/python-split-string-with-multiple-delimiters – Jake
我不知道爲什麼它在這段代碼中做到了這一點,我把它放在我的ipynb文件中 –