2015-11-12 143 views
3

我正在使用lxml來解析一些html。 HTML看起來像:解析html與<br>標籤(Python)

<td valign="top">first text field<br>second text field</td> 

而且不,break標記沒有關閉在任何地方。

element.text返回兩個中的第一個,element.xpath('string()')返回兩個都沒有\n或其他分隔符。

我想我只能解析兩次,並從後者中「減去」前者,如果我只想要第二個文本字段,但這並不理想。我認爲必須有其他方式來獲得第二個文本字段,但我很難過。

回答

2

回答了我自己。 element.xpath('text()')返回一個我正在尋找的東西的數組。

+0

您可以將此答案標記爲已接受。根據SO的說法, – felipsmartins

+1

@felipsmartins沒有另外2天 – AutomaticStatic