0
我試圖提取只有下面的div
中的文本,但不是a
中的文本。如何忽略HtmlUnit中的子元素內容
<div class="about">
<a class="link" href="www.example.com"> Text I don't Want </a>
" Text I do want "
</div>
這是我的代碼:
HtmlDivision personAge = htmlPage.getByXPath("//div[@class='about']");
String personAgeText = personAge.asText();
System.out.println(personAgeText);
輸出:
Text I don't Want Text I do want
我想以某種方式排除元素a
的內容。有什麼建議麼?謝謝!