-7
from bs4 import BeautifulSoup
import urllib2
import urllib
import os
url=urllib.urlopen("https://www.google.co.in/search?q=cow&biw=1242&bih=606&source=lnms&tbm=isch&sa=X&ved=0ahUKEwi21oLAqqzKAhXNjo4KHVs0DkgQ_AUIBigB")
soup=BeautifulSoup(url)
li=soup.find_all('a')
for links in li:
imgUrl=links.get('href')
sp1=imgUrl.split('imgurl=')[1]
sp2=sp1.split('&')[0]
urllib.urlretrieve(sp2)
我想從此網頁下載所有圖像。我下載的鏈接是谷歌圖片網頁的源代碼。當代碼針對一個圖像單獨執行,但使用find_all
下載多個圖像時,它可以正常工作,但會出錯。爲什麼我的代碼返回IndexError:列表索引超出範圍?
在問一個問題之前,你需要做一些調試。嘗試打印出你從imgUrl.split('imgurl =')'返回的內容,如果這是失敗的行。如果失敗的行是第二行,則輸出'sp1.split('&amp')'的結果。 –