2012-08-28 417 views
0

這不會很容易回答,所以我想要一些指導,而不是: 我想下載圖像形式的網絡服務器。我知道如何從網址獲取圖片,但我不知道我可以找到多少頁。 (例如,第01章有21張圖像,第02章只有12 ...)蟒蛇從網址下載圖片

在網頁上有一個組合框(DropdownChoice),告訴該章節有多少頁。有什麼方法可以獲取這些信息?

如果我知道這一點,我可以爲做從第1頁到第x頁並下載每張圖片。

fyi我正在使用python

謝謝!

+0

這樣的事情? http://stackoverflow.com/questions/5974595/download-all-the-linksrelated-documents-on-a-webpage-using-python/5976423#5976423 –

回答

2

作爲一種快速入侵,您可以直接下載順序頁面,直到獲得404(或其他錯誤)。這通常不被認爲是「好的」,因此請謹慎使用它,但它可以讓您輕鬆下載所有圖像。

或者,您可以查看使用Scrapy包來幫助您下載和解析網頁和圖像。

+0

+1。雖然我會說使用try:...除了HTTPError:...塊是一種非常有效的方法(可能檢查except塊中的HTTPError類型並在必要時重新提升) 。對於我來說,如果你對except語句做了充分的具體說明(例如「IOError」肯定會很糟糕),那麼對我來說這似乎並不算什麼。 – Moritz

+0

嗯,這是服務器上的黑客攻擊,而不是客戶端。也就是說,下載頁面直到你打到404是(至少對我來說)不是好的形式。但是,嘿,它的工作原理,如果這是一次性項目,那麼我完全可以。 – nneonneo