獲取和使用機械化

我想在python但每次它會被重定向到index2.php（從網絡服務器的位置標頭）獲取的樣本頁面獲取和使用機械化

從而節省重定向之前HTTP響應例如代碼打印從index2.php而不是index.php的反應是否有避免？

2014-10-28 Sama Azari

你只想抓取一個網頁的源代碼？ – DuckPuncher 2014-10-28 23:41:54

是的，只是爲了搶源。所以我可以解析它。 – 2014-10-29 00:05:36

您可以使用urllib2或requests更復雜的東西。

import urllib2 

response = urllib2.urlopen("http://google.com") 
page_source = response.read()

urllib2是一個內置的模塊和requests是第三方。

2014-10-29 00:12:17 DuckPuncher

這是不正確的，因爲urllib2.urlopen將遵循重定向。雖然我不想要這樣的事情發生。 – 2014-10-29 00:15:19

@SamaAzari，那麼你的例子中的網址不會重定向，我不想出去尋找一個網頁。我只是不知道我的頭頂上有什麼。 – DuckPuncher 2014-10-29 00:26:28

回答