我有了套文本的文本文件,我需要提取看起來像如下:如何提取兩個不同比賽之間的文字?
ITEM A blah blah blah ITEM B bloo bloo bloo ITEM A blee blee blee ITEM B
這裏是工作的代碼我到目前爲止:
finda = r'(Item\sA)'
findb = r'(Item\sB)'
match_a = re.finditer(finda, usefile, 2) # the "2" is a flag to say ignore case
match_b = re.finditer(findb, usefile, 2)
我知道,我可以使用span,start和end等命令來查找匹配的文本位置。但我需要做很多次所以我需要的是:
- 開始寫在項目A,並停止在B項議題
- 寫如果第一次迭代少於50個字符,然後丟棄和移動下一個
- 一旦你找到了一組與項目A開始,以項目B結束,大於50個字符寫入到一個文件
由於一噸提前!我一直在旋轉我的輪子。
您應該使用先行斷言爲最終定界符允許開始和結束分隔符的重疊。 – Gumbo 2010-06-22 17:46:18
謝謝!一旦我明白了這一切意味着什麼,我才能使其工作。 – dandyjuan 2010-06-22 18:25:16