2017-03-16 58 views
-2
<span> 
<a></a> 
Hello 
<div>A very lot of unnecessary text</div> 
</span> 

所以我想從網頁中提取「Hello」。我可以通過XPath選擇範圍,但是如果我在其上調用.getTextContent(),我也會得到div中的內容,但是我希望這些不必要的文本不會被提取。我怎樣才能做到這一點?從Java中的兩個標記中獲取信息HtmlUnit

+0

請提供您嘗試示例代碼爲止。 –

+0

String s = page.getElementsByTagName(「span」)。get(0).getTextContent(); – Jeswer

+0

我不知道如何獲取錨點和div之間的文本 – Jeswer

回答

0

您應該能夠使用XPath直接將文本顯示在回答這個link