我使用Beautifulsoup4來解析網頁。與Bing的工作方式類似,如果您輸入搜索詞,則它將返回前10個匹配,並在第2頁,第3頁等列出的後續頁面上進行後續匹配...查詢確實包含第2頁的超鏈接後返回的第一個頁面直到最後一頁。我想要建立的正是最後一頁(例如,第87頁)。使用Python的網頁表格中的最後超鏈接
下面是從頁面的HTML源代碼的樣本:
<tr><td colspan=4 align=left class='uilt'>����� ������� ��������: 3543.<br>��������: 1 <a href="/main/search.php?str=&tag=&nopass=&cat=25&page=2">2</a> <a href="/main/search.php?str=&tag=&nopass=&cat=25&page=3">3</a> <a href="/main/search.php?str=&tag=&nopass=&cat=25&page=4">4</a> <a href="/main/search.php?str=&tag=&nopass=&cat=25&page=5">5</a> <a href="/main/search.php?str=&tag=&nopass=&cat=25&page=6">6</a> <a href="/main/search.php?str=&tag=&nopass=&cat=25&page=7">7</a> <a href="/main/search.php?str=&tag=&nopass=&cat=25&page=8">8</a> <a href="/main/search.php?str=&tag=&nopass=&cat=25&page=9">9</a> <a href="/main/search.php?str=&tag=&nopass=&cat=25&page=10">10</a> <br></td></tr>
在上面的例子中,我將如何制定出的最後一個環節是10頁?上面有更多的HTML,所以我不能簡單地從HTML代碼的末尾分割X個位置。
感謝
你需要使用BeautifulSoup嗎?如果你使用Selenium,你不需要它。 – 2015-03-08 22:03:12
我使用Beautifulsoup進行大部分解析,只是使用硒來模擬用戶實際輸入的特定術語 – thefragileomen 2015-03-08 22:04:48