2010-11-20 37 views

回答

1

這是我會怎麼做它在Python:

  • 提取每個需要從抓取圖像頁面(簡單,只需使用mechanize或其他一些HTTP擷取程式庫)
  • 分析每個HTML文件搶圖片網址。這多一點參與 - 看看HTMLParser。從內存中,您可以子類HTMLParser只抓取您感興趣的文本。在這種情況下,這是來自HTML img標記的src屬性,例如。像<img src="this is what you want" width=640 height=480/>
  • 取獲得上述(容易)每個圖像

就個人而言,雖然,我不會使用Python這一點。上述方法的第一步和最後一步很容易用wget完成。第二個可以使用grep執行,bash可將所有內容連接在一起。事實上,這幾乎是我推薦的here

也就是說,如果你在Linux上。如果你沒有bash,並且Python可能是你的下一個最佳選擇。