2014-01-22 39 views
0

嘗試所有但未完成。這裏是代碼:任何方式Jsoup可以解析「JavaScript?」數據?

public LocalTimes(City newCity) throws IOException { 
     setCity(newCity); 
     setDoc(Jsoup.connect("http://www.turkishairlines.com/tr-tr/ucak-bileti/" + city.getName()) 
       .userAgent("Mozilla/5.0 (Windows NT 6.1; WOW64; rv:19.0) Gecko/20100101 Firefox/19.0") 
       .header("Content-type", "application/x-www-form-urlencoded") 
       .method(Connection.Method.GET) 
       .timeout(5000) 
       .post()); 
     Element babas = doc.getElementById("div.clock-gmt > span"); 
} 

我需要標籤「span」內的值,這是城市的gmt值。因爲我認爲這是通過JavaScript執行我無法獲得文本(),也沒有價值。

請有什麼建議?

+0

過去有同樣的問題;我所做的是使用http://htmlunit.sourceforge.net/獲取內容,然後使用jsoup解析內容; htmlunit也會運行javascript;如果您認爲有幫助,我可以添加代碼 – user1121883

+0

是的。也許這可以給我一個提高。 – mummert

+0

你能否提供一個網址;嘗試了幾個喜歡,但沒有奏效:http://www.turkishairlines.com/tr-tr/ucak-bileti/Istanbul – user1121883

回答

0

什麼值? span元素爲空

<div class="clock"> 
    <div class="clock-day"> 
     Çarşamba 
    </div> 
    <div class="jsClock"></div> 
    <div class="clock-gmt"> 
     GMT <span></span> 
    </div> 
.... 
+0

坦率地說,這就是問題所在。該值不會流向html,因爲它是。如果通過Chrome devtool進行檢查,它也會顯示在頁面上。 – mummert

+0

嗯,我不能在頁面上看到這個跨度值,請給出完整的鏈接。例如, – MariuszS

+0

http://www.turkishairlines.com/tr-tr/ucak-bileti/istanbul。 – mummert