0
我需要處理少量文本(即python中的字符串)。如何在解析python字符串時保留重複標點符號?
我想刪除某些標點符號 (如'.', ',', ':', ';',
)
,但保持標點符號表示像('...', '?', '??','???', '!', '!!', '!!!'
)
也有七情六慾的,我想刪除無信息的詞作爲'a', 'an', 'the'
。 此外,到目前爲止最大的挑戰是如何解析「我有」或「我們有」最終得到「我有」和「我們有」?撇號使我感到困難。
什麼是最好/最簡單的方法來做到這一點在Python中?
例如:
"I've got an A mark!!! Such a relief... I should've partied more."
結果我想:
['I', 'have', 'got', 'A', 'mark', '!!!', 'Such', 'relief', '...',
'I', 'should', 'have', 'partied', 'more']
運行你試過* *什麼做到這一點? –
是的!我已經嘗試了幾個正則表達式,但是我要實現一個或另一個目標,而不是全部。 – Oleksandra
然後發佈他們並解釋什麼是錯的,也許有人可以幫助解決它們。 –