2011-08-26 62 views
1

我正在使用python的lxml.html。我有一個xpath表達式來抓取節點的文本,但我需要的是所有文本,包括子標記的標記及其內容。我如何實現這一目標?in lxml.html我如何獲取文本,子節點和子節點的內容?

+0

你能否解釋一下你是否需要「元素內的所有文本」,或者說「元素的源代碼」? (或者是其他東西?) – Steven

回答

1

Elementtext_content方法返回元素的文本,包括沒有標記的子元素的文本內容。

0

我不確定你正在使用什麼標籤;因此,我彌補某事。

你可以試着做某事,如:

result = lxml.html.parse(url).xpath("//tr/td/a/text()") 

// TR意味着選擇節點從無論身在何處,他們都符合選擇當前節點在文檔中。

您可以使用此('//')表達式來繪製子標記的標記。

相關問題