0
我正在使用X射線來廢除分頁的網頁。下面是一些HTML通過文本的X射線分頁過濾器
<td align="center" style="font-size: 11pt;">
<div class="paginate" style="font-size: 11pt;">
<span class="disabled">Previous</span>
<span class="current">1</span>
<a href="link2.html">2</a>
<a href="link2.html">Next</a>
</div>
</td>
我想通過Next
按鈕報廢。但是網頁的例子被它的類名稱所掠奪。
x('https://blog.ycombinator.com/', '.post', [{
title: 'h1 a',
link: '[email protected]'
}])
.paginate('.nav-previous [email protected]')
我想知道如何通過選擇Next
按鈕中的鏈接來分頁?
在此先感謝。
寫這篇文章我會寫一個自定義的解析器,將適合你的需求最好。 – Lazyexpert
@Lazyexpert我想你是對的,我試圖懶惰通過使用X射線。但它似乎並不適合。最初我使用request + cheerio,但我試圖廢除子頁面(共4層)。刮4層依次緩慢,你知道我怎麼能將它轉換成並行請求? – Winston
你可以使用Promise.all,你可以使用async.parallel或者再次使用基於回調的自定義解決方案:) – Lazyexpert