我試圖用Jsoup解析一個html文檔來獲取所有標題標籤。此外,我需要將標題標籤分組爲[h1] [h2]等...Jsoup:獲取所有標題標籤
hh = doc.select("h[0-6]");
但是這給了我一個空的數組。
我試圖用Jsoup解析一個html文檔來獲取所有標題標籤。此外,我需要將標題標籤分組爲[h1] [h2]等...Jsoup:獲取所有標題標籤
hh = doc.select("h[0-6]");
但是這給了我一個空的數組。
你的選擇器意味着帶有屬性「0-6」的h-Tag這裏 - 不是正則表達式。但是,您可以結合使用多個選擇器:hh = doc.select("h0, h1, h2, h3, h4, h5, h6");
。
分組:您是否需要一組h1標籤+每個h1,h2,...標籤或每個h1,h2,...標籤的組?
下面是一個例子你如何能做到這一點:
// Group of all h-Tags
Elements hTags = doc.select("h1, h2, h3, h4, h5, h6");
// Group of all h1-Tags
Elements h1Tags = hTags.select("h1");
// Group of all h2-Tags
Elements h2Tags = hTags.select("h2");
// ... etc.
如果你想爲每個H1組,H2,...標籤則可以刪除第一選擇,並與其他doc
更換hTags
。
使用doc.select(「h1,h2,h3,h4,h5,h6」)獲取所有標題標籤。 使用doc.select(「h1」)分別獲取每個標籤。在http://preciselyconcise.com/apis_and_installations/jsoup/j_selector.php
中查看您可以使用select語句做的各種事情完美地工作,非常感謝! – Tropicalista
太棒了! :-)但是,如果它有效,請將線程標記爲已解決。 – ollo