2015-05-26 169 views
0

什麼即時試圖做的是使刮刀,有一個登錄頁面,即時填寫三分之二需要三個值的獲取下一個頁面的Python解析XML

刮板需要用戶名上,密碼的單行然後令牌,

即時通訊自動填充的用戶名和密碼和ive縮小到PHP的一個輸入標籤的HTML響應。

的標籤代碼:

<input type="hidden" name="licence[_csrf_token]" value="SOME RANDOM CHECKSUM" id="licence__csrf_token" /> 

有沒有得到這個任何方式和方式的校驗和是動態的,如它改變長度。

+0

你是什麼意思「得到這個」呢?另外,你用什麼工具從HTML中提取輸入標籤? –

回答

0

BeautifulSoup是解析任意的HTML一個好辦法:

from bs4 import BeautifulSoup 

html_doc = '''<input type="hidden" 
        name="licence[_csrf_token]" 
        value="SOME RANDOM CHECKSUM" 
        id="licence__csrf_token" />''' 

soup = BeautifulSoup(html_doc) 
print soup.input['value']