1
我有這樣一個文件的文件:獨立段落
cluster number 1
1
2
3
cluster number 2
1
2
3
cluster number x
1
2
3
我想分割的簇號段這個文件,這樣
cluster number 1
1
2
3
我試圖尋找一個答案但我無法處理它。 感謝您的幫助!
我有這樣一個文件的文件:獨立段落
cluster number 1
1
2
3
cluster number 2
1
2
3
cluster number x
1
2
3
我想分割的簇號段這個文件,這樣
cluster number 1
1
2
3
我試圖尋找一個答案但我無法處理它。 感謝您的幫助!
用戶正則表達式
import re
input_text = "..."
r = re.findall(r"(cluster number (\d+)\n\n(\d+)\n\n(\d+)\n\n(\d+))", input_text)
print r
文章
[('cluster number 1\n\n1\n\n2\n\n3', '1', '1', '2', '3'),
('cluster number 2\n\n1\n\n2\n\n3', '2', '1', '2', '3')]
這個代碼回報,你還可以看到從here
的詳細解釋,建議,你應該使用正則表達式。也許re.split函數適合這裏:
>>> l = re.split('cluster number (?:\d+)', x)[1:]
>>> [a.split() for a in l]
[['1', '2', '3'], ['1', '2', '3'], ...]
用什麼語言? – Barmar
我想追加到Barmars語言問題,以及從什麼文件格式? – tremor
要添加到兩個:你到目前爲止嘗試過什麼? –