有些奇怪假設我有這樣的代碼:的XPath scrapy
<div class="page-header" align="center">
<h4>[<a href='[email protected]%200DAY' data-placement='top' rel='tooltip' data-original-title='Browse 0DAY'><strong>FIRST</strong></a>] SECOND-</a><a href=/[email protected]%20GUSH rel='tooltip' data-original-title='Find more from GUSH'><b>THIRD</b></a> <h6>FOUR<br> <br/></h6> Search:
<a href="https://xxx1">xxx</a>,
</h4>
<br/>
</div>
我想文先過濾,第二,第三和四。我如何使用XPATH執行此操作?
我已經測試了這一點,沒有成功:
'//div[@class="page-header"]/h4/text()' (for filter SECOND)
'//div[@class="page-header"]/h4/a[@rel=\'tooltip\']/text()' (for filter THIRD)
你提出的HTML沒有很好形成。 「SECOND」文本後面沒有開頭部分,有一個關閉的'a'標籤。 – alecxe
很奇怪']二線' – splash58
問「你能幫助我與XPath的?」答案 - >「是」或「否」。詢問「我如何使用XPATH執行此操作?」可能會爲您描述如何真正做到這一點。請重新閱讀[help→tour](http://stackoverflow.com/tour)關於不要分心,不要聊天:感謝不應該成爲問題的一部分。 – Anthon