如果你想要的是使用wget
下載的東西,爲什麼不在標準python庫中嘗試urllib.urlretrieve?
import os
import urllib
image_url = "https://www.google.com/images/srpr/logo3w.png"
image_filename = os.path.basename(image_url)
urllib.urlretrieve(image_url, image_filename)
編輯:如果圖片是動態的腳本重定向,您可以嘗試requests
包處理重定向。
import requests
r = requests.get(image_url)
# here r.url will return the redirected true image url
image_filename = os.path.basename(r.url)
f = open(image_filename, 'wb')
f.write(r.content)
f.close()
我還沒有測試代碼,因爲我沒有找到合適的測試用例。 requests
的一大優勢是它也可以處理authorization。
EDIT2:如果圖像是動態生成的腳本服務,像gravatar圖像,通常可以找到在響應頭的content-disposition
字段名。
import urllib2
url = "http://www.gravatar.com/avatar/92fb4563ddc5ceeaa8b19b60a7a172f4"
req = urllib2.Request(url)
r = urllib2.urlopen(req)
# you can check the returned header and find where the filename is loacated
print r.headers.dict
s = r.headers.getheader('content-disposition')
# just parse the filename
filename = s[s.index('"')+1:s.rindex('"')]
f = open(filename, 'wb')
f.write(r.read())
f.close()
EDIT3:由於@Alex在評論所說,你可能需要清理在返回的報頭中的編碼filename
,我覺得剛纔得到的基名就可以了。
import os
# this will remove the dir path in the filename
# so that `../../../etc/passwd` will become `passwd`
filename = os.path.basename(filename)
檢查這個http://stackoverflow.com/questions/3979888/in-python-scipting-how-do-i-capture-output-from-subprocess-call-to-a-file – avasal