http://puu.sh/3Krct.png如何防止下載HTML /文本頁面爲png格式
我的程序生成隨機鏈接到承載圖像的服務,它抓住和下載隨機圖像。該程序提出了很多請求,因此它必須通過代理。那麼,當程序啓動時,我只是給它一個新的大代理列表的路徑;然而,有時代理不會連接到網站,有時他們會返回一個自定義HTML頁面 - 或者圖像服務會在頁面上返回消息「您無權查看此圖像」。雖然,該方案仍然會保存請求,並與巴紐擴展下載頁面
所以有時候那些HTML /文本頁面保存爲.png文件:
有什麼辦法可以阻止下載這些頁面,只下載實際的圖片?
謝謝。
if self.proxy != False:
#make our requests go through proxy
self.opener.retrieve(url, filename)
else:
urllib.request.urlretrieve(url, filename)
因此,您通過猜測文件名並隱藏在多個代理之後,無法從不屬於您的網站抓取圖片? – msw
這個問題似乎是脫離主題,因爲它是關於黑客行爲。 – msw
@msw圖像是公開的。所以這不是黑客行爲。如果他們想要,他們可以把它變成私人的。 – Justin