2014-10-28 60 views
2

我想在python但每次它會被重定向到index2.php(從網絡服務器的位置標頭)獲取的樣本頁面獲取和使用機械化

從而節省重定向之前HTTP響應例如代碼打印從index2.php而不是index.php的反應是否有避免?

+0

你只想抓取一個網頁的源代碼? – DuckPuncher 2014-10-28 23:41:54

+0

是的,只是爲了搶源。所以我可以解析它。 – 2014-10-29 00:05:36

回答

1

您可以使用urllib2requests更復雜的東西。

import urllib2 

response = urllib2.urlopen("http://google.com") 
page_source = response.read() 

urllib2是一個內置的模塊和requests是第三方。

+0

這是不正確的,因爲urllib2.urlopen將遵循重定向。雖然我不想要這樣的事情發生。 – 2014-10-29 00:15:19

+1

@SamaAzari,那麼你的例子中的網址不會重定向,我不想出去尋找一個網頁。我只是不知道我的頭頂上有什麼。 – DuckPuncher 2014-10-29 00:26:28