2013-07-29 64 views
-1

我使用jsoup來解析HTML頁面,當使用doc.select("tr")時,它應該返回一個包含所有<tr>元素的列表。當我調查該列表的大小時,它會告訴我242.儘管使用Chrome通過簡單的搜索來檢查源代碼時,它獲得了264次點擊。Jsoup不會給我一個我要求的完整列表

這使我的代碼中斷。看起來就像jsoup很難處理很多元素。

我用一張表,262 * 88個單元格和幾乎同樣多的幫助器標籤解析一個頁面。這是爲什麼jsoup沒有列表中的對象?或者你爲什麼覺得我有這個問題?

+3

C你提供樣本數據和[SSCCE](http://sscce.org)? – jlordo

+1

沒有任何代碼或任何關於標記的線索都無法提供幫助。 –

+1

@Kim Kling ...你問得好嗎? – SRy

回答

0

網站可能存在差異。如果您使用桌面瀏覽器,則通常會看到不同的視圖。一個移動設備。

你可以用jsoup試試這個:

  1. 使用其他瀏覽器設置的瀏覽器的用戶代理
  2. 打印解析文檔(System.out.println(doc)),並檢查是否所有的標籤都包含
  3. 檢查網站
  4. 檢查是否沒有創建額外html的javascript(或類似)(jsoup無法處理這些)
相關問題