2017-10-15 70 views
0

我有一個XML文件,我需要提取特徵標籤內部的所有文本在Python如何從XML標記值在Python

<person> 
    <text id="1"> 
    <title> 
     student 
    </title> 
    <feature> 
     xxxx 
     <name>yyyy</name> 
     zzzz 
     <country>dddd</country> 
     ffff 
    </feature> 

我的代碼是這樣的:

for person in tree.iter(): 
    for text in person: 
     for feature in text: 
      if feature.tag=="feature": 
       print(feature.text) 

它只顯示我的「xxxx」,但我的理想的答案是 XXXX YYYY ZZZZ DDDD FFFF

+0

讓XML節點包含文本內容和其他XML節點是非常不尋常的。可能爲什麼你有問題。 – Dijkgraaf

回答

0

當然還有一個線末(</person>)失蹤。並且你應該評論你正在使用哪個庫,如果有的話

如果你使用一個庫把xml解析成樹結構,比如說xml.etree.ElementTree,你很容易通過查詢函數提取標籤,屬性甚至文本圖書館。您可以按照您需要的順序進行操作,並以您需要的格式創建結果。

xml.etree.ElementTree是Python標準庫的一部分。看看Python ElementTree documentation。有很多例子。