2011-11-29 77 views
-1

我想提取一個xml文件中的所有標籤。但是,我無法編寫適當的正則表達式來提取我想要的內容。如何編寫正則表達式來提取標籤?

該文件中的標籤格式是這樣的:

Tags=<"tracffic""apple""sample"> 

而且我想返回一個列表包含了所有的標籤:交通,蘋果,樣品]

我嘗試這樣做:

Tags=<("[\w]+")+ 

哪些只返回最後一個標籤。

任何人都可以幫我一把嗎?

+3

你確定這是XML?你可以發佈樣本嗎? – FailedDev

回答

1

試試這個:

m = re.search('<(".+")>', 'Tags=<"traffic""apple""sample">') 
tags = [x for x in m.group(1).split('"') if x] 

現在tags包含:

['traffic', 'apple', 'sample'] 
+0

謝謝。我沒有想到匹配後拆分整個字符串的方式。 :) – AnneS