2015-01-12 61 views
2

所以我正在做這個網站刮我的應用程序。我需要下載驗證碼圖像以顯示給用戶。但每次訪問驗證碼網址時,它都會生成一個新的驗證碼。我怎樣才能下載動態生成的驗證碼進行自動登錄python腳本獲取驗證碼

如:https://academics.vit.ac.in/student/stud_login.asp

這裏我下載使用下面的腳本>>>

from bs4 import BeautifulSoup 
import urllib2 
import urllib 

url = "https://academics.vit.ac.in/student/stud_login.asp" 
content = urllib2.urlopen(url) 
soup = BeautifulSoup(content) 
img = soup.find('img',id ='imgCaptcha') 
print img 
urllib.urlretrieve(img['src'],'captcha.bmp') 

驗證碼,但一些這個腳本似乎並不怎麼樣上班。

1)一個解決方案是截圖並裁剪驗證碼。 但我需要一個不同的解決方案,因爲我要在各種屏幕尺寸的設備上工作,所以採取屏幕截圖無法解決目的。

+1

請刪除經典的asp標籤 – pee2pee

回答

1

img['src']返回一個相對 url - captcha.asp。在使用之前,您必須將其設置爲絕對網址(https://academics.vit.ac.in/student/captcha.asp)。

import urlparse 
urllib.urlretrieve(urlparse.urljoin(url, img['src']), 'captcha.bmp')