我使用XPath來取消一個網頁獲取的價值,但我有麻煩的代碼的一部分:的Python的XPath只能從根元素
<div class="description">
here's the page description
<span> some other text</span>
<span> another tag </span>
</div>
我使用此代碼從要素獲得的價值:
description = tree.xpath('//div[@class="description"]/text()')
我能夠找到正確的div我要找的,但我只想要得到的文本「這裏的頁面描述」不是從內部span標籤
內容任何人都知道我怎樣才能得到的文本根節點,但不是來自子節點的內容?
那xpath表達式不應該包含跨度的內容,只能是div直接子節點的文本節點的內容:'[「\ n這裏是頁面描述\ n」,'\ n','\ n']' – mata