這應該很容易,但我卡住了。Scrapy - 根據文字選擇具體的鏈接
<div class="paginationControl">
<a href="/en/overview/0-All_manufactures/0-All_models.html?page=2&powerunit=2">Link Text 2</a> |
<a href="/en/overview/0-All_manufactures/0-All_models.html?page=3&powerunit=2">Link Text 3</a> |
<a href="/en/overview/0-All_manufactures/0-All_models.html?page=4&powerunit=2">Link Text 4</a> |
<a href="/en/overview/0-All_manufactures/0-All_models.html?page=5&powerunit=2">Link Text 5</a> |
<!-- Next page link -->
<a href="/en/overview/0-All_manufactures/0-All_models.html?page=2&powerunit=2">Link Text Next ></a>
</div>
我試圖使用Scrapy(Basespider)選擇基於它的鏈接是一個使用鏈接文字:
nextPage = HtmlXPathSelector(response).select("//div[@class='paginationControl']/a/@href").re("(.+)*?Next")
例如,我想基於這樣的事實,選擇下一個頁面鏈接它的文本是「鏈接文本下一頁」。有任何想法嗎?
謝謝你們。我使用了@unutbu的建議,它工作得很完美。 –
所以沒有CSS選擇器的方式來做到這一點? – deostroll