我使用robobrowser來抓取這個頁面,在頁面裏面有一個textarea
標籤,裏面有我需要複製和存儲的信息。如何從標籤中提取文本?
這是我的代碼:
>>> captchacode = captchabrowser.find('textarea')
>>> print(captchacode)
<textarea cols="100" rows="5">03AHJ_VuvjiQUpaQ-JFLXqAJaUQ217f7bHqa3hG__VSG1YsbjNtsT2FGFrJksCansOxwuxniksyCsnHJTvlCeGdi2jeqUyuDfUGAQ1WIuJqO55ACslBSUnd-MtAMDIOmbTa1G9uh1QMBdZUTRXwmt1kOn7oNf6ZflnUGAtIOGeTSgx-wu8hOWY-Pw</textarea>
如何通過他們的自我得到
<textarea cols="100" rows="5">XXXXXX</textarea>
我需要XXXXX
在變量中的文本。
有一個格式錯誤,把數據放在textarea裏面是不好的HTML。它應該是'',請注意這一點。 –
@aarongillion我刮的網站有這樣的,我不能改變它:( –
這很好,我只是指出它 –