-1
我想提取一個xml文件中的所有標籤。但是,我無法編寫適當的正則表達式來提取我想要的內容。如何編寫正則表達式來提取標籤?
該文件中的標籤格式是這樣的:
Tags=<"tracffic""apple""sample">
而且我想返回一個列表包含了所有的標籤:交通,蘋果,樣品]
我嘗試這樣做:
Tags=<("[\w]+")+
哪些只返回最後一個標籤。
任何人都可以幫我一把嗎?
我想提取一個xml文件中的所有標籤。但是,我無法編寫適當的正則表達式來提取我想要的內容。如何編寫正則表達式來提取標籤?
該文件中的標籤格式是這樣的:
Tags=<"tracffic""apple""sample">
而且我想返回一個列表包含了所有的標籤:交通,蘋果,樣品]
我嘗試這樣做:
Tags=<("[\w]+")+
哪些只返回最後一個標籤。
任何人都可以幫我一把嗎?
試試這個:
m = re.search('<(".+")>', 'Tags=<"traffic""apple""sample">')
tags = [x for x in m.group(1).split('"') if x]
現在tags
包含:
['traffic', 'apple', 'sample']
謝謝。我沒有想到匹配後拆分整個字符串的方式。 :) – AnneS
你確定這是XML?你可以發佈樣本嗎? – FailedDev