獨立段落

我有這樣一個文件的文件：獨立段落

cluster number 1 

1 

2 

3 

cluster number 2 

1 

2 

3 

cluster number x 

1 

2 

3

我想分割的簇號段這個文件，這樣

cluster number 1 

1 

2 

3

我試圖尋找一個答案但我無法處理它。感謝您的幫助！

用什麼語言？ – Barmar

我想追加到Barmars語言問題，以及從什麼文件格式？ – tremor

要添加到兩個：你到目前爲止嘗試過什麼？ –

用戶正則表達式

import re 
input_text = "..." 
r = re.findall(r"(cluster number (\d+)\n\n(\d+)\n\n(\d+)\n\n(\d+))", input_text) 
print r

文章

[('cluster number 1\n\n1\n\n2\n\n3', '1', '1', '2', '3'), 
('cluster number 2\n\n1\n\n2\n\n3', '2', '1', '2', '3')]

這個代碼回報，你還可以看到從here

2013-10-06 01:59:09 Curry

的詳細解釋，建議，你應該使用正則表達式。也許re.split函數適合這裏：

>>> l = re.split('cluster number (?:\d+)', x)[1:] 
>>> [a.split() for a in l] 
[['1', '2', '3'], ['1', '2', '3'], ...]

2013-10-06 08:37:31 Erez

回答