2012-11-27 39 views
0

我試圖從網上下載網頁。我能夠竊取HTML(使用URLlib),但我無法正確下載圖像。儘管這已經有一個問題了。我的問題是,有沒有什麼辦法可以使用python繞過防火牆訪問'阻止'的網頁?使用Python 3.3訪問被阻止的網頁

理想情況下,它會使用一些模糊的代碼或模塊,但如果這是不可能的,有人可以告訴我一個很好的解決方法,使用不同的方法(如代理)?

+7

繞過防火牆(至少是「真正的」防火牆)與Python或任何其他編程語言無關;它純粹在網絡層面。 – Pondlife

回答

1

如果你想從一個HTML頁面中提取圖像,需要用解析它重新使用正則表達式只提取IMG SRC標籤模塊

import re 

。你也可以使用一個解析器編寫。例如BeautifulSoup>http://www.crummy.com/software/BeautifulSoup/

防火牆是外圍防禦到計算機網絡的被動組件,也可以作爲網絡的兩個或多個部分之間的接觸點,從而確保網絡自身的安全保護。所以你必須直接在網絡中工作,而不是通過代碼語言。

+0

我知道你不能很容易地改變網絡設置,但是有沒有一種方法可以隱藏你通過python從網上下載的內容? – Dakeyras

+0

我不認爲它可以直接使用Python,除非您在已經「保護」的環境中不使用SSL/TLS或HTTPS等加密協議。 –