2011-07-22 74 views
-3

我想使用的urllib與Python,使刮刀,我可以下載圖片,但他們是一個縮略圖,250x250的或更小。(我想4chan的,因爲我喜歡的一些圖片線程) 如何獲得完整圖像? 這裏是我的代碼需要幫助的一個Python刮刀

import urllib2, urllib 
from BeautifulSoup import BeautifulSoup 
import re 
import urlparse 

i = 0 

ext = "'src' : re.compile(r'(jpe?g)|(png)|$'" 

url = raw_input("Enter URL here:") 
ender = raw_input("Enter File Type Here(For Images enter 'img'):") 
if ender == "img": 
    ender = 'img', {'src' : re.compile(r'(.jpe?g)|(.png)|(.gif)$')} 

else: 
    if "." in ender: 
     end = ender 
    else: 
     end = ".%s" % ender 


raw = urllib.urlopen(url) 
soup = BeautifulSoup(raw) 

parse = list(urlparse.urlparse(url)) 

for ender in soup.findAll(ender): 
    links = "%(src)s"% ender 
    print links 
    str(links) 
    if ".jpg" in links: 
     end = ".jpg" 
    if ".jpeg" in links: 
     end = ".jpeg" 
    if ".gif" in links: 
     end = ".gif" 
    if ".png" in links: 
     end = ".png" 
    i += 1 
    urllib.urlretrieve(links, "%s%s" % (i, end)) 
+0

對4chan的,圖像是超鏈接一樣,只是提取的「href」部分並下載。 –

+0

但是如果我想在另一個網站上使用它們呢? –

+2

編寫腳本來解析4chan上的完整路徑。因爲我在工作,我不認爲人們會理解我的4chan的做的東西,我不能給你寫一個例子:P –

回答

2

因爲你可以點擊查看大環節,在<a href="url">是圍繞圖像標記指向完整圖像的URL。

所以剛看完href屬性的值,並下載,而不是圖像的src屬性,該屬性。