2016-11-22 197 views
-2

我想選擇與Jsoup選擇HTML標籤與Jsoup

<html> 
<head></head> 
<body> 
..... 
</body> 
</html> 

所有的HTML標籤代碼,我試過了:

Document dc = Jsoup.parse(fichier, "utf-8"); 
String tags = dc.outerHtml(); 
+2

...,什麼是您嘗試輸出?對於我們來幫助解決您的問題,我們需要更多的上下文:請查看[如何提出一個好問題]的指導原則(http://stackoverflow.com/help/how-to-ask) – emunsing

+0

您可以添加你想要選擇什麼樣的例子,它與你的代碼有什麼不同? – Pshemo

回答

1

你的問題目前尚不清楚,但似乎你只是想獲得所有的標籤節點名稱,這樣做,你可以解析HTML和getAllElements(),然後遍歷列表元素得到nodeName()每個,使用Java 8利用forEach您的代碼可能是這樣的:

import org.jsoup.Jsoup; 
import org.jsoup.nodes.Document; 
import org.jsoup.select.Elements; 

public class JSoup { 

    public static void main(String[] args) { 

     String fichier = "<html>" + 
          "<head></head>" + 
          "<body></body>" + 
          "</html>"; 
     Document dc = Jsoup.parse(fichier, "utf-8"); 
     Elements elements = dc.getAllElements(); 
     elements.forEach(element -> System.out.println(element.nodeName())); 
    } 
} 

這個代碼打印出所有的標籤節點名稱:

#document 
html 
head 
body