1
我正在使用HTMLDocument迭代器來嘗試遍歷HTMLDocument中的所有標記。但是,迭代器似乎跳過嵌套在p標籤中的標籤。例如:HTMLDocument迭代器跳過標記
<html>
<body>
<a href = "somesite"> some site </a>
<p>
<a href = "someothersite"> some other site </a>
</p>
</body>
</html>
迭代器都將獲得第一個標籤(somesite),但它不會去到一個標籤p標籤(someothersite)內。
下面的代碼:
private void getLinks() throws MalformedURLException {
HTMLDocument.Iterator it = content.getIterator(HTML.Tag.A);
it.next();
while(it.isValid()) {
// Do something
it.next();
}
}
任何人都可以說明爲什麼?
啊 - 事實證明,它是第一個it.next()之前進入循環.. – Kumalh