我的代碼只返回一個空字符串,我不知道爲什麼。Python中的圖像抓取程序無法按預期運行
import urllib2
def getImage(url):
page = urllib2.urlopen(url)
page = page.read() #Gives HTML to parse
start = page.find('<a img=')
end = page.find('>', start)
img = page[start:end]
return img
它只會返回它找到的第一個圖像,所以它不是一個很好的圖像刮板;那說,我現在的主要目標就是能夠找到一張圖片。我無法。
知道如何使用正則表達式是有用的技術,但它不是爲網絡以任何方式刮「更好的選擇」。 – root