2016-02-04 59 views
-1

我試圖從一個大的XML文件中的所有屬性值正則表達式查找所有XML屬性值

s = '<some id="Foo" menu="BAAR"></some>' 
output = re.findall('="(.*)"' ,s) 
print output 

我期待了把

['Foo','BAAR'] 

但是我越來越

['Foo" menu="BAAR'] 

任何人都可以請幫我指出我做錯了什麼嗎?

+0

不使用正則表達式來解析XML! – Daniel

+0

你可能會發現這很有用,使用xpath –

回答

-1

在正則表達式*是貪婪的,這意味着,它需要儘可能多的。只使用非貪婪版本*?

s = '<some id="Foo" menu="BAAR"></some>' 
output = re.findall('="(.*?)"' ,s) 
print output