2016-10-17 113 views
0

我一直在嘗試使用minidom,但沒有真正的偏好。出於某種原因,lxml不會安裝在我的機器上。解析xml樹的屬性(文件中沒有元素)

我想解析XML文件:

<?xml version="1. 
    -<transfer frmt="1" vtl="0" serial_number="E5XX-0822" date="2016-10-03 16:34:53.000" style="startstop"> 
     -<plateInfo> 
       <plate barcode="E0122326" name="384plate" type="source"/> 
       <plate barcode="A1234516" name="1536plateD" type="destination"/> 
     </plateInfo> 
     -<printmap total="1387"> 
      <w reason="" cf="13" aa="1.779" eo="299.798" tof="32.357" sv="1565.311" ct="1.627" ft="1.649" fc="88.226" memt="0.877" fldu="Percent" fld="DMSO" dy="0" dx="0" region="-1" tz="18989.481" gy="72468.649" gx="55070.768" avt="50" vt="50" vl="3.68" cvl="3.63" t="16:30:47.703" dc="0" dr="0" dn="A1" c="0" r="0" n="A1"/> 
      <w reason="" cf="13" aa="1.779" eo="299.798" tof="32.357" sv="1565.311" ct="1.627" ft="1.649" fc="88.226" memt="0.877" fldu="Percent" fld="DMSO" dy="0" dx="0" region="-1" tz="18989.481" gy="72468.649" gx="55070.768" avt="50" vt="50" vl="3.68" cvl="3.63" t="16:30:47.703" dc="0" dr="0" dn="A1" c="1" r="0" n="A2"/> 
     </printmap> 
    </transfer> 

的文件沒有任何元素的細節,你可以看到。所有信息都包含在屬性中。爲了適應另一個SO帖子,我有這個 - 但它似乎更多地面向元素。我也失敗了一個很好的方式來「瀏覽」xml信息,即我想說「dir(xml_file)」,並列出了我可以在我的樹結構上執行的所有方法,或者查看所有屬性。我知道這是很多和可能不同的方向,但提前謝謝你!

def parse(files): 
    for xml_file in files: 
     xmldoc = minidom.parse(xml_file) 
     transfer = xmldoc.getElementsByTagName('transfer')[0] 
     plateInfo = transfer.getElementsByTagName('plateInfo')[0] 
+0

有沒有使用ElementTree的一個原因 - 雅知道,[Python標準庫中提供的那個](https://docs.python.org/2/library/xml.etree.elementtree.html)? 「minidom」是最老的開箱即用的XML庫之一,它顯示出來了。 –

回答

0

隨着minidom命名可以訪問使用該方法的屬性,然後可以作爲字典來治療的特定元素的屬性;這個例子迭代並打印元素遷移[0]的屬性:

from xml.dom.minidom import parse, parseString 
xml_file='''<?xml version="1.0" encoding="UTF-8"?> 
    <transfer frmt="1" vtl="0" serial_number="E5XX-0822" date="2016-10-03 16:34:53.000" style="startstop"> 
     <plateInfo> 
       <plate barcode="E0122326" name="384plate" type="source"/> 
       <plate barcode="A1234516" name="1536plateD" type="destination"/> 
     </plateInfo> 
     <printmap total="1387"> 
      <w reason="" cf="13" aa="1.779" eo="299.798" tof="32.357" sv="1565.311" ct="1.627" ft="1.649" fc="88.226" memt="0.877" fldu="Percent" fld="DMSO" dy="0" dx="0" region="-1" tz="18989.481" gy="72468.649" gx="55070.768" avt="50" vt="50" vl="3.68" cvl="3.63" t="16:30:47.703" dc="0" dr="0" dn="A1" c="0" r="0" n="A1"/> 
      <w reason="" cf="13" aa="1.779" eo="299.798" tof="32.357" sv="1565.311" ct="1.627" ft="1.649" fc="88.226" memt="0.877" fldu="Percent" fld="DMSO" dy="0" dx="0" region="-1" tz="18989.481" gy="72468.649" gx="55070.768" avt="50" vt="50" vl="3.68" cvl="3.63" t="16:30:47.703" dc="0" dr="0" dn="A1" c="1" r="0" n="A2"/> 
     </printmap> 
    </transfer>''' 
xmldoc = parseString(xml_file) 
transfer = xmldoc.getElementsByTagName('transfer') 
attlist= transfer[0].attributes.keys() 
for a in attlist: 
    print transfer[0].attributes[a].name,transfer[0].attributes[a].value 

,你可以在這裏找到更多的信息:

http://www.diveintopython.net/xml_processing/attributes.html