我必須從文本文件中提取文本。如何使用python regex提取重複性文本ifrom文本文件?
Reg.No .________ xajh SAK斯卡AJS kajk SAK Reg.No .________ 灑灑爲AA莎莎的爸爸Reg.No .________阿達德
y=re.findall(r'(?=(Reg.No.________[^Reg.No.________]*Reg.No.________))',te, flags=re.DOTALL)
輸出應該是這樣的:
列表[0] = Reg.No .________ xajh SAK斯卡AJS kajk SAK
列表[1] = Reg.No .________赤竹爲AA莎莎爸
列表[2] = Reg.No .________ adad
到目前爲止您嘗試過什麼,出了什麼問題? – CAustin
y = re.findall(r'(Reg。+?)Reg',te,flags = re.DOTALL) –
我試過這個,但它不能正常工作,它跳過一些模式 –