2016-01-25 56 views
1

我在這個HTML格式的數據在python:提取值

<input type="hidden" name="__EVENTTARGET" id="__EVENTTARGET" value="" > 
<input type="hidden" name="__EVENTARGUMENT" id="__EVENTARGUMENT" value="" /> 
<input type="hidden" name="__VIEWSTATE" id="__VIEWSTATE" value="ky6272M5yMyLqwLSiOD7282n7W/4c5S+PsBnbknDUX8d4iGsUDPboCpQG3F86cgBN3u3/nrEYLDN43eRdevxKrBv6MBnwC8l0l3WLxFOKGpqGUl5KzodoLbQB44LtcSYLudbO+lczSjwyEzsHOrw3IW4VT1HAT/OjPJI36AIf/BAXY/UoKT38X1yrDNE0sf0jk5WOPq+v+wh+Dsw9F6dojZXucY5dmGdNWaigKKn6VSG6tkzqsCFVjYEkzTjj1ItCdstnDZv2LVHRJpQ654Zvcf2IkQOR7p+V+TLRYdR9yOngXh2p/qt6UXYrR4DVUPkgxiCuIjFpSpYvGmHuw3+ocadeLklAtAQZbQF63c+xyogyV4Dm2fW2BT1+fhW+lqoo5aTFcWM+2v2SwfSsRKOMUH9MudewVDP0ro/3w9+OPq1q8hHGDzzbwDJh7nOvyW67DYY1AEp2NV1lCbDwazCX0DHpW/prlmuFMj1zt+mamjoGERWNujqr6FQNgSG1n62VrJMdBhEwYdHNYuWEQorD/EA3ze/5Pmxv7j6PngmoNv9uVtOwq4M3RhtgjS4OY5RsBO8l+Ij74Mqihh5xa0T3D2p5VIBZJW5M3nb6c1yuNqgcNgstqNU2BDwE/T1h+sF8wK7BG0YKQd6BrilABj1+AZZElrS9SdDtjuyKFGWEx2qLHUpWrkys4yy3Icq7xSsf/eDsg==" /> 

我想一個方法來提取使用python的正則表達式的值屬性的內容。

+1

我的數據是這樣的: alone

+2

你一定要使用正則表達式嗎?你可以使用像[BeautifulSoup](http://www.crummy.com/software/BeautifulSoup/bs4/doc/)這樣的解析器,但是我明白如果你想把依賴關係保持在最低限度。 – wpercy

+1

我如何使用它來提取值? – alone

回答

2

html可以更復雜。

from bs4 import BeautifulSoup 


html = '<input type="hidden" name="__EVENTTARGET" id="__EVENTTARGET" value="" >' 
soup = BeautifulSoup(html, 'lxml') 
input_tag = soup.find('input') 
input_tag['value'] 
1

隨着BeautifulSoup,您可以使用BeautifulSoup類的查找方法,並提取屬性的值,像這樣:

from bs4 import BeautifulSoup 
x = """<input type="hidden" name="__EVENTTARGET" id="__EVENTTARGET" value="" >""" 
soup = BeautifulSoup(x) 
print soup.find('input')['value']