基於正則表達式拆分文件內容：python

patt=re.compile("\s*[\n]*rule.*[\n]*\s*.*{") 

results=re.split(r'\s*[\n]*rule.*[\n]*\s*.*{.', buf)

結果不包含它看起來像分裂不正常的list.but。任何人都可以幫忙嗎？

-----------文件內容-------

rule rule1{ 

meta: 

desc-test1 


} 

rule rule2{ 

meta: 

desc-test2 


} 

rule rule3{ 

meta: 

desc-test3 


}

----文件端---------- 預期產量

規則裏面可以有「規則字符串」。所以一個規則應該被標識爲 規則ruleName {**內容可以是任何包含新行字的任何字符串} **。規則內容將受花括號限制。我應該能夠將規則提取到列表中。規則[0]應該包含規則1及其內容。類似於rule2。

2016-02-16 user846940

這個問題目前還不清楚，請添加您希望*的輸出。 – donkopotamus

results=re.split(r'\s*[\n]*rule.*[\n]*\s*.*{.', buf)

所以，

results = re.split(r'\brule\s+', buf)[1:]

應該做（的[1:]丟棄第一rule之前的部分）。

2016-04-12 06:24:19 Armali

回答