2013-12-12 69 views
0

我想解析python中的xml字符串。我正在字符串中搜索特定標記ops:cpc。我怎樣才能得到實際的價值?在下面的例子中,預期的結果是A61K9/00解析python中的xml數據

content = '<?xml version="1.0" encoding="UTF-8" standalone="yes"?>\n<ops:world-patent-data xmlns:ops="http://ops.epo.org" xmlns:reg="http://www.epo.org/register" xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:cpc="http://www.epo.org/cpcexport" xmlns:cpcdef="http://www.epo.org/cpcdefinition">\n <ops:meta name="elapsed-time" value="20"/>\n <ops:classification-scheme>\n  <ops:mappings inputSchema="ECLA" outputSchema="CPC">\n   <ops:mapping additional-only="false">\n    <ops:ecla>A61K9/00</ops:ecla>\n    <ops:cpc xlink:href="classification/cpc/A61K9/00">A61K9/00</ops:cpc>\n   </ops:mapping>\n  </ops:mappings>\n </ops:classification-scheme>\n</ops:world-patent-data>\n' 

xmldoc = minidom.parseString(content) 
itemlist = xmldoc.getElementsByTagName('ops:cpc') 
print len(itemlist) 
+0

爲什麼不使用三引號?這更可讀。 – jazzpi

+0

這就是我的'GET'給了我想要處理的結果。 – user1140126

回答

2

使用nodeValue屬性的子文本節點:

>>> itemlist[0].childNodes[0].nodeValue 
u'A61K9/00'