2014-12-03 47 views
0

我正在將txt文件讀入python,並且想要使段落符合一致。有時候會有1,2,3,4 ...段落之間偶爾會有數十或數百條空行。如何確保python中的每個段落之間有兩個換行符

明顯地很容易去掉所有的中斷,但是我只能想到把所有事情都做成兩個中斷的「拙劣的」方式(即每個段落之間的單一空白行)。所有我能想到的將會指定多個條/替換爲不同的可能的組合中斷...當中斷的數量非常大時變得笨拙......或者反覆刪除多餘的中斷,直到剩下兩個,我想這會是慢,並不是特別可擴展到成千上萬的文本文件...

是否有一個適度的快速處理[/簡單]的方式來實現這一目標?

回答

2
import re 
re.sub(r"([\r\n]){2,}",r"\1\1",x) 

您可以嘗試this.Here x將是您一個包含所有段落的字符串。

+0

你忘了引用第二個參數。 – Praxeolitic 2014-12-03 06:14:20

+0

@Praxeolitic thanx :)編輯 – vks 2014-12-03 06:15:00

+0

@vks這是完美的...非常感謝你! :-) – kyrenia 2014-12-03 18:18:13

1

這是一種方法。

import os 
f = open("text.txt") 
r = f.read() 
pars = [p for p in r.split(os.linesep) if p] 
print (os.linesep * 2).join(pars) 

這是假設的段落我們的意思是一段文字不包含換行符。

相關問題