2012-02-17 106 views
14

我嘗試獲取名爲bg_block_info的div類中包含的所有信息,但是我獲得了另一個div類的信息<div class="bg_block_info pad_20">爲什麼我錯了?在JSoup中按類獲取元素

Document doc = Jsoup.connect("http://www.maib.md").get(); 
Elements myin = doc.getElementsByClass("bg_block_info"); 

回答

10

該元素具有類(注意bg_block_infopad_20之間的空間):

<div class="bg_block_info pad_20"> 

所以確實有類bg_block_info和你的代碼工作正常。

+0

你救我一小時。 – 2012-08-07 09:54:10

0

在你的情況下,你可能會使用Element content = doc.getElementById("pollsstart");而不是Elements myin = doc.getElementsByClass("bg_block_info");

16

您可以結合和鏈選擇來優化查詢,例如:

Document doc = Jsoup.connect("http://www.maib.md/").get(); 
Elements els = doc.getElementsByClass("bg_block_info").not(".pad_10").not(".pad_20"); 
1
Elements downloadLinks = dContent.select("a[href]"); 
Elements pdfLinks = downloadLinks.select("a[data-format$=pdf]"); 

完全參考jsoup selector syntax