2013-04-01 35 views
1

我有問題,使用Jsoup從網頁提取一些數據。Jsoup - 提取標籤:命名空間

下面是代碼:

<fb:comments-count href="" fb-xfbml-state="rendered" class=" fb_comments_count_zero"> 
<span class="fb_comments_count">0</span></fb:comments-count> 

而且,我試圖提取0fb_comments_count class這一點。

+0

你打算怎麼做?顯示你的代碼! – Cristian

+0

當我嘗試提取fb | comments-count即使我解析整個網頁,我也沒有收到內部類。我永遠無法看到內部類 – copied

回答

1

你真的需要fb:comments-count標籤嗎?您可以使用`doc.select(「span.fb_comments_count」)直接選擇span.fb_comments_count

但是,如果你需要的外標籤:

Document doc = ... 

Element commentsCount = doc.select("fb|comments-count > span.fb_comments_count").first(); 

System.out.println(commentsCount.text()); 

此打印第一匹配變量的值。如果你需要全部然後用循環代替。

+0

我已經嘗試過,問題是當我第一次獲得文檔,並將其打印到控制檯時,我無法看到span.fb_comments_count和其他一切正常,由於某些原因jsoup wont解析這個。 – copied

+0

如果僅解析問題中的html,該怎麼辦?同樣的問題?順便說一句。你使用什麼版本? – ollo

+0

我不知道你可以使用ns |標籤通過標籤在命名空間中查找元素,很高興知道http://jsoup.org/cookbook/extracting-data/selector-syntax –