我有一段文本要清理。問題是新線太多了。當我使用text=open(file, 'r')
和text=text.read()
打開文本時,我看到很多很難清理的新行。我想刪除整個以下文本。我們使用re.sub
刪除它們。因爲有太多的新行,我需要11行re.sub
命令。更糟糕的是,How
,Working
,You
或Briefing
過於籠統,所以即使我不想擦除它們,它們也可以從體內移除。我可以使用re.sub命令like,清理(Re.sub)當文本中有太多的python新行時
remove1 = 'How'
remove2 = 'Can I Help'
remove3 = 'in Touch'
remove4 = 'Working'
remove5 = 'Briefing'
remove6 = 'Room'
remove7 = 'Meeting'
remove8 = 'You'
remove9 = 'F.A.Q'
text = re.sub(quant1, '', text)
text = re.sub(quant2,'', text)
text = re.sub(quant3, '', text)
text = re.sub(quant4, '', text)
text = re.sub(quant5, '', text)
text = re.sub(quant6, '', text)
text = re.sub(quant7, '', text)
text = re.sub(quant8, '', text)
text = re.sub(quant9, '', text)
有沒有更好的方法來清除它?我不想一條一條地做。我想一次刪除兩行How Can I Help?
。我不想包含像How
這樣的一般詞。
如果我使用text.readlines()
,結果如下所示。
'\tHow\r\n', 'Can I Help?\r\n', ' \t Keep \r\n', 'in Touch\r\n', ' \t Working \r\n',
'for You\r\n', ' \t Briefing \r\n', 'Room\r\n', ' \t Meeting \r\n', 'You\r\n', ' \t F.A.Q.\r\n'
謝謝! '''''是一個很好的解決方案。但問題是當我做''''.join(['How','我能幫忙'))',那麼我的文檔中的每個'How'都將被刪除。我只想擦除下一行有'我可以幫助'的'How'。我只展示了我的文字的一部分。在我的文章中,我有一堆我不想刪除的「怎樣」。我試過''&',但它不起作用。 – user3077008
@ user3077008:嗯...那麼怎麼樣使用'怎樣(?= \ s +我可以幫忙嗎?)'而不是? –