2012-10-20 187 views
7

我試圖用Jsoup解析一個html文檔來獲取所有標題標籤。此外,我需要將標題標籤分組爲[h1] [h2]等...Jsoup:獲取所有標題標籤

 hh = doc.select("h[0-6]"); 

但是這給了我一個空的數組。

回答

19

你的選擇器意味着帶有屬性「0-6」的h-Tag這裏 - 不是正則表達式。但是,您可以結合使用多個選擇器:hh = doc.select("h0, h1, h2, h3, h4, h5, h6");

分組:您是否需要一組h1標籤+每個h1,h2,...標籤或每個h1,h2,...標籤的組?

下面是一個例子你如何能做到這一點:

// Group of all h-Tags 
Elements hTags = doc.select("h1, h2, h3, h4, h5, h6"); 

// Group of all h1-Tags 
Elements h1Tags = hTags.select("h1"); 
// Group of all h2-Tags 
Elements h2Tags = hTags.select("h2"); 
// ... etc. 

如果你想爲每個H1組,H2,...標籤則可以刪除第一選擇,並與其他doc更換hTags

+0

中查看您可以使用select語句做的各種事情完美地工作,非常感謝! – Tropicalista

+0

太棒了! :-)但是,如果它有效,請將線程標記爲已解決。 – ollo