2016-06-01 108 views
2

我正在使用Scrapy來抓取數據。如何使用XPath選擇鏈接的內部文本?

JS控制檯上我的瀏覽器中,輸入$x('//div[@class="summary"]//div[contains(@class, "tags")]')即可獲得我需要的內容,但需要過濾數據。

以下圖片爲$x('//div[@class="summary"]//div[contains(@class, "tags")]')命令結果。

JS console result

我應該怎麼寫xpath命令來獲取綠色框中的數據?我試過$x('//div[@class="summary"]//div[contains(@class, "tags")]//a[contains(@class, "post-tag")]'),但那不是我想要的。

謝謝!

+0

爲什麼你跳過「中的python-2.7」?背後的邏輯是什麼? (我認爲這是你的意思'不是我所需要的') – har07

+0

@ har07,我需要得到正確的xpath腳本來過濾JS控制檯中的數據。看到[xpath](http://www.w3schools.com/xsl/xpath_intro.asp) –

+0

@ har07,對不起,我忘了在上面放一個盒子。謝謝!!! –

回答

4

要選擇選擇div<a>元素的內部文本,你只需要追加/a/text()到您的XPath它選擇div

//div[@class="summary"]//div[contains(@class, "tags")]/a/text()