2017-04-17 53 views
0

這裏是網址: http://immobilier.nc/recherche?section=offres_vente&bien=&prix_location=&prix_vente=&pays=nc&ville=&quartier=&par_page=25&orderBy=&orderDirection=DESC&moteurRecherche_option=last_offrJSoup無法檢索這個文檔

這裏是我的代碼:

Jsoup.connect(url) 
        .timeout(10000) 
        .followRedirects(true) 
        .validateTLSCertificates(false) 
        .get(); 

的問題是,我得到不同的網頁瀏覽器上的一個。

例如,這個標籤是不是在Jsoup文件(但在瀏覽器中):

<tr style="cursor:pointer;" id="235005" class="showOffre setPushStat ajax" href="menu_detail_offre.php?checksum=IM-O-58cf724c03e64" data-divdest="detail_235005" data-godiv="detail_235005" data-pushstat_url="!O-235005"> 
      <td align="left" style="vertical-align:middle"><img src="/photos.immobilier.nc//gw/2017/4/_thumbs/bb3dfed8-66f6-4a6b-939a-a47b70c998ba.jpeg" width="100"></td> 
      <td nowrap="" align="left" style="vertical-align:middle"> 235005</td> 
      <td align="left" style="vertical-align:middle">Vente</td> 
      <td align="left" style="vertical-align:middle"><img src="http://immobilier.nc/images/part_promobat_mini.jpg" style="display: none !important;"> </td> 
      <td align="left" style="vertical-align:middle">Appartement</td> 
      <td align="left" style="vertical-align:middle">F3</td> 
      <td align="left" style="vertical-align:middle">Nouméa</td> 
      <td align="left" style="vertical-align:middle">Ouémo</td> 
      <td nowrap="" align="left" style="vertical-align:middle">35.278 U</td> 
      <td align="left" style="vertical-align:middle">17/04/2017</td> 
      </tr> 

回答

1

的一部分,你要顯示它是第一次請求缺少的是包含報價表的內容。該表格通過ajax調用http://immobilier.nc/immo_offres.php從網頁加載,然後集成到顯示的網頁中。

Jsoup從您顯示爲瀏覽器的url加載相同的內容,但僅加載第一頁。 Jsoup不會解釋頁面中的JavaScript代碼,也不會額外加載其他數據,因此您不會獲得與瀏覽器加載頁面時所用的內容相同的內容,並且可以使用其他ajax調用的結果填充該內容。

+0

所以解決方案是用適當的參數調用http://immobilier.nc/immo_offres.php? – Tyvain

+0

取決於你想要達到的目標。如果您想要抓取該網頁的內容,那可能是一個解決方案,但請記住,這些網址可能會隨時更改。 –