我想在python但每次它會被重定向到index2.php(從網絡服務器的位置標頭)獲取的樣本頁面獲取和使用機械化
從而節省重定向之前HTTP響應例如代碼打印從index2.php而不是index.php的反應是否有避免?
我想在python但每次它會被重定向到index2.php(從網絡服務器的位置標頭)獲取的樣本頁面獲取和使用機械化
從而節省重定向之前HTTP響應例如代碼打印從index2.php而不是index.php的反應是否有避免?
import urllib2
response = urllib2.urlopen("http://google.com")
page_source = response.read()
urllib2
是一個內置的模塊和requests
是第三方。
這是不正確的,因爲urllib2.urlopen將遵循重定向。雖然我不想要這樣的事情發生。 – 2014-10-29 00:15:19
@SamaAzari,那麼你的例子中的網址不會重定向,我不想出去尋找一個網頁。我只是不知道我的頭頂上有什麼。 – DuckPuncher 2014-10-29 00:26:28
你只想抓取一個網頁的源代碼? – DuckPuncher 2014-10-28 23:41:54
是的,只是爲了搶源。所以我可以解析它。 – 2014-10-29 00:05:36