2012-05-02 38 views
1

有一個互聯網網站,我想檢查一下這個互聯網網站的搜索結果是否發生了變化,因爲上次我檢查了一個變化。解析來自表格的信息

該網站有2個需要填寫的字段(例如「出生日期」和「從什麼時候開始」),然後給出所有在特定年份和在那個地方燒傷的孩子的結果。

我想使用python檢查查詢結果的變化,然後發送我的電子郵件發生了變化。

我應該使用哪一個python工具來發送我對Internet站點感興趣的值並解析結果?

這裏是領域的一部分,我需要填補:

<fieldset class="set1 required"> 
    <label for="">Wann wurde Ihr Kind geboren? *</label> 
    <input name="tbGeburtsdatum" id="tbGeburtsdatum" class="datepickerGeburt hasDatepicker" maxlength="10" onblur="this.value = formatiereDatum(this.value)" type="text"> 
    <small class="errormessage">Bitte geben Sie ein gültiges Datum ein</small> 
    <span id="infoGeburt" class="legende"></span> 
</fieldset> 
<fieldset class="set2 required"> 
    <label for="">Ab wann soll Ihr Kind betreut werden? *</label> 
    <input name="tbBetreuungAb" id="tbBetreuungAb" class="datepickerVon hasDatepicker" maxlength="10" onblur="this.value = formatiereDatum(this.value)" type="text"> 
    <small class="errormessage">Bitte geben Sie ein gültiges Datum ein</small> 
</fieldset> 
<fieldset class="set3 optional"> 
    <label for="">Bis wann soll Ihr Kind betreut werden?</label> 
    <input name="tbBetreuungBis" id="tbBetreuungBis" class="datepickerBis hasDatepicker" maxlength="10" onblur="this.value = formatiereDatum(this.value)" type="text"> 
</fieldset> 

編輯

我寫的填寫兩個字段代碼:

import mechanize 
import cookielib 
from BeautifulSoup import BeautifulSoup 
import html2text 
import filecmp 

# Browser 
br = mechanize.Browser() 

# Cookie Jar 
cj = cookielib.LWPCookieJar() 
br.set_cookiejar(cj) 

# Browser options 
br.set_handle_equiv(True) 
br.set_handle_gzip(True) 
br.set_handle_redirect(True) 
br.set_handle_referer(True) 
br.set_handle_robots(False) 

# Follows refresh 0 but not hangs on refresh > 0 
br.set_handle_refresh(mechanize._http.HTTPRefreshProcessor(), max_time=1) 

# The site we will navigate into, handling it's session 
br.open('https://www.meinkitaplatz-leipzig.de/') 

# Select the first (index zero) form 
br.select_form(nr=0) 

# User credentials 
br.form['tbGeburtsdatum'] = '01.12.2011' 
br.form['tbBetreuungAb'] = '26.09.2012' 

# Login 
br.submit() 

br.retrieve('https://www.meinkitaplatz-leipzig.de/WFSuche.aspx','yourfavoritepage_new.html') 

print filecmp.cmp('yourfavoritepage_new.html', 'yourfavoritepage.html') 

編輯2

</tbody></table><table id="gvXErgebnisListe_DXMainTable" class="dxgvTable_EpErgebnisGrid" summary="&lt;script language=&quot;javascript&quot; type=&quot;text/javascript&quot;&gt;var geoData = new Array(&quot;1|2| |0|0|6d96147a-641f-4411-8331-4436cd405c99|FAIRbund TPP3|Nord&quot;);var geoDataGes = new Array(&quot;1|2| |0|0|6d96147a-641f-4411-8331-4436cd405c99&quot;);&lt;/script&gt;" style="width: 100%; border-collapse: collapse; empty-cells: show;" border="0" cellpadding="0" cellspacing="0"> 
     <tbody><tr id="gvXErgebnisListe_DXDataRow0" class="dxgvDataRow_EpErgebnisGrid"> 
          <td id="gvXErgebnisListe_tcrow0" colspan="17" style="border-right-width: 0px; border-bottom-width: 0px;"> 
      <div class="resultlistEntry" id="resultlistEntry1"> 
      <div class="resultlistHead" id="1"> 
      <a class="linkTitle" href="#" onclick="return false;"> 
       <strong>Nord, FAIRbund TPP3</strong>     
       <small> 
       <strong> Vorschlag: 26.09.2012 - 30.11.2014</strong> 
       </small> 
      </a> 
      <a class="linkMappin" href="#" onclick="jumpToLocation(new Array('1','0','0', 'FAIRbund TPP3', 'Nord'));" title="Auf der Karte zeigen" alt="Auf der Karte zeigen"> 
       <span class="mappin mappin-tpp-klein"></span> 
      </a> 
      </div> 
      <div style="display: none;" class="resultlistContent" id="resultlistContent1"> 
      <p> 
       Die Tagespflegeperson FAIRbund TPP3 befindet sich im Stadtbezirk Nord. Hier werden bis zu 5 Kinder betreut. 
      </p> 
      <p class="clearfix"> 
      <input name="Details1" id="Details1" class="buttonGeneralForward" value="Details" type="submit"> 
      </p> 
      </div> 
     </div> 
     </td> 
    </tr> 

我想分析這個HTML文本表 「北,FAIRbund TPP3」,「Vorschlag:2012年9月26日 - 二〇一四年十一月三十日」

並將結果保存到文件中。

完整的html文件可以在yourfavoritepage_new.html找到。

+3

「孩子這是燒錢」?他們有一個網站? –

+0

這是一個領域的例子,而不是我搜索的真實的東西.... – Eagle

回答