我試圖將字符串拆分爲單詞和標點符號,將標點符號添加到拆分生成的列表中。將字符串拆分爲單詞和標點符號
例如:
>>> c = "help, me"
>>> print c.split()
['help,', 'me']
我真正想要列表樣子是:
['help', ',', 'me']
所以,我想在從單詞的標點符號分裂空白字符串分割。
我試着先分析字符串,然後再運行分裂:
>>> for character in c:
... if character in ".,;!?":
... outputCharacter = " %s" % character
... else:
... outputCharacter = character
... separatedPunctuation += outputCharacter
>>> print separatedPunctuation
help , me
>>> print separatedPunctuation.split()
['help', ',', 'me']
這將產生我想要的結果,但對大文件非常緩慢。
有沒有辦法更有效地做到這一點?
對於本例(不是一般情況)`c.replace('','')。partition(',')` – 2016-11-21 08:59:51