我試圖從網頁獲取一些數據,但是我發現了一個問題。每當我想要進入下一頁(即第2頁)以繼續檢索其上的數據時,我總是從第1頁接收數據。顯然嘗試切換到下一頁出現了問題。urllib2沒有檢索帶有哈希值的url
的事情是,我還沒有與網址的問題是這樣的:
'http://www.webpage.com/index.php?page=' + str(pageno)
我就可以開始了一段聲明,我就加1「您做生意」
跳轉到第2頁我的問題來時,我試圖打開一個URL這種格式:
'http://www.webpage.com/search/?show_all=1#sort_order=ASC&page=' + str(pageno)
由於
urllib2.urlopen('http://www.webpage.com/search/?show_all=1#sort_order=ASC&page=4').read()
將會從http://www.webpage.com/search/?show_all=1
的源代碼有沒有其他方法來檢索其他頁面,而無需使用散列,就我而言。
我想這只是urllib2忽略散列,因爲它通常用於指定瀏覽器的起點。
在#標記之後有一個查詢字符串是無稽之談 - 這永遠不會是一個有效的URL。 – 2012-08-15 12:07:34