我有一個xml文件,我從網址下載。然後我想遍歷xml以找到具有特定文件擴展名的文件的鏈接。迭代通過XML找到具有特定擴展名的網址與python
我的XML看起來是這樣的:
<Foo>
<bar>
<file url="http://foo.txt"/>
<file url="http://bar.doc"/>
</bar>
</Foo>
我寫代碼來獲取XML文件是這樣的:
import urllib2, re
from xml.dom.minidom import parseString
file = urllib2.urlopen('http://foobar.xml')
data = file.read()
file.close()
dom = parseString(data)
xmlTag = dom.getElementsByTagName('file')
然後我「喜歡」來獲得類似的財產以後這個工作:
i=0
url = ''
while(i < len(xmlTag)):
if re.search('*.txt', xmlTag[i].toxml()) is not None:
url = xmlTag[i].toxml()
i = i + 1;
** Some code that parses out the url **
但是,這會引發錯誤。任何人都有更好的方法提示?
謝謝!
是的,這一切都還挺總值今天。我上週剛拿起python。但是,這完美的作品!只需將「url = file_node.getAttribute('urls')'這一行更改爲'url = file_node.getAttribute('url')',它就像魅力一樣。謝謝! – ZacAttack 2012-07-10 22:17:40
@ZacAttack derp,錯誤更正。 – 2012-07-10 22:19:28