此XML文檔包含一組標記events-data
。我想從最近的events-data
中提取信息。例如,在下面的代碼中,我想要去最後events-data
標記,下去event-date
標記並提取date
子標記的文本。目前我在Python中使用BeautifulSoup來遍歷這個文檔。有任何想法嗎?BeautifulSoup XML Python從特定標記中提取屬性
<?xml version="1.0" encoding="UTF-8"?>
<first-tag>
<second-tag>
<events-data>
<event-date>
<date>20040913</date>
</event-date>
</events-data>
<events-data> #the one i want to traverse to grab date text
<event-date>
<date>20040913</date>
</event-date>
</events-data>
</second-tag>
</first-tag>
我在想,在'elementtree'或'minidom'在那裏你可以穿越基於索引和長度的標籤,但我想不出一個語法(或找到一個這樣的事情),這將適用於BeautifulSoup。請記住,我仍然是美麗的新手。 – sdweldon
不知何故,它必須計算'events-data'發生的次數,可能是'numEvents = len(soup.find('events-data'))',然後在該索引處讀取子標記? – sdweldon