2015-11-27 65 views
-1

我使用HTML解析器庫for java hereJava中的HTMLParser

由於文檔較少,我解決了一些問題,並指出我建議HTML解析器快速,比JSOUP容易出錯代碼(Jsoup實際上很容易使用,但容易被激怒在您的代碼:()

  1. 是你如何能在HTML頁面 提取元數據,說明這種2.How你能明確得到從解析的HTML文檔

三江源單個標籤元素!

+0

您是否嘗試過Tika? https://tika.apache.org/1.2/parser.html – HRgiger

+0

謝謝,但我不想使用 – danielad

回答

1

獲取標籤「MyTag」,您還可以搜索標籤< meta>

Parser parser = new Parser(); 
parser.setInputHTML(MyHTML); 
parser.setEncoding("UTF-8"); 
NodeList nl = parser.parse(null); 
NodeList node_list= nl.extractAllNodesThatMatch(new TagNameFilter("MyTag"),true);