2012-07-01 167 views
0

我試圖用jsoup來抓取網站的數據。但是在獲得一些文本時遇到一些問題。在HTML的jsoup選擇元素

部分看起來像這樣

<p class="time">9:00</p> 

,我可以使用的代碼行搶罰款:

Document doc = Jsoup.connect(url).get(); 
doc.select("p.time").text()); 

但HTML的下位看起來是這樣的:

<p class="date"><strong>FRIDAY 27<sup>th</sup></strong> JULY 2012</p> 

我不知道如何得到。使用該行:

doc.select("p.date").text()); 

剛剛得到一個空字符串。我嘗試了一些變體(即選擇「p.date」,然後嘗試date.select(「strong」)),但只是繼續提供一個空字符串。

我該如何着手獲取日期文本?

+0

怎麼樣'doc.select( 「p.date」)孩子(0)的.text();'例如?或'doc.select(「p.date strong」)。text();' – Daniel

回答

1

無法重現您的問題。

Document doc = Jsoup.parse("<html><body><p class=\"date\"><strong>FRIDAY 27<sup>th</sup></strong> JULY 2012</p></body></html>"); 
String s = doc.select("p.date").text(); 
System.out.println(s); 

這版畫: 「FRIDAY 2012年7月27日」