我想使用jTidy從(真實世界)HTML中提取數據。但jTidy不解析自定義標籤。如何將新標籤添加到JTidy?
<html>
<body>
<myCustomTag>some text</myCustomTag>
<anotherCustom>more text</anotherCustom>
</body>
</html>
我無法獲得自定義標記之間的文本。我必須使用jTidy,因爲我將使用xpath。
我試過HTMLCleaner,但它不支持完整的xpath函數。
這是否解決了您的問題? – Ethan
另請參見https://stackoverflow.com/questions/30374232/jtidy-pretty-print-custom-html-tag – Pino