2014-01-27 86 views
3

我正在使用Jsoup獲取所有從在線漫畫網站的特定漫畫章節的圖像只使用第一頁鏈接。風格屬性不顯示使用jsoup

我已成功檢索到的總頁號和第一頁的src,例如:如果與此鏈路提供的「http://www.mangapanda.com/feng-shen-ji/1/1」的輸出將是:

總頁數:49

標題:封神記1

IMAGEURL:http://i15.mangapanda.com/feng-shen-ji/1/feng-shen-ji-2974919.jpg

什麼,我想現在要做的是,以獲取第二頁的src,然後自動增量得到休息。到第二頁的鏈接在HTML爲:

<div id="prefetchimg" style="background-image: url("http://i34.mangapanda.com/feng-shen-ji/1/feng-shen-ji-2974921.jpg");"></div>

但是當我使用jsoup作爲

String url = "http://www.mangapanda.com/feng-shen-ji/1"; 
Document doc = Jsoup.connect(url).userAgent("Mozilla").get(); 
Elements div = doc.select("div"); 
for (Element divParse : div) { 
if(divParse.id().equals("prefetchimg")) 
System.out.println(divParse);} 

我只得到

<div id="prefetchimg"></div> 

而不是

<div id="prefetchimg" style="background-image: url("http://i34.mangapanda.com/feng-shen-ji/1/feng-shen-ji-2974921.jpg");"></div> 

如何獲取樣式屬性? enter image description here

+0

實際上,查看頁面的HTML源代碼時沒有任何樣式屬性。你確定嗎? – eltabo

+0

我使用螢火蟲檢查html元素。通過使用螢火蟲查看此鏈接的「http://www.mangapanda.com/feng-shen-ji/1」的html,我得到了這個「

」 – sameerror

+2

好吧,在你的情況下,你的標籤已經被javascript函數,所以Jsoup無法看到這個屬性。 – eltabo

回答

0

@eltabo

好了,你的情況,你的標籤已被一個javascript函數修改,所以Jsoup無法看到此attribut

這是真實的,JSoup僅用於Html頁面。對於使用JS的Html,例如HtmlUnit

+0

謝謝我會試試 – sameerror

+0

嗯... HtmlUnit似乎是我特別不想在這一刻。感謝您和@eltabo,我現在使用Jsoup來檢索