例如,我想從以下HTML代碼中抓取name1,name2,name3和name4。如何使用Jsoup提取此數據?
<td width="200"><a>name1</a></td>
<td width="200">name2 </td>
<td width="200"><a>name3</a></td>
<td width="200">name4 </td>
現在,如果您發現名1,和NAME3在標籤一個,但是NAME2,和NAME4在標籤TD。我用兩個獨立的代碼來獲取名稱,但效率低下且速度慢。上面的HTML代碼只是真實代碼的一部分。
try {
doc = Jsoup.connect("http://somesite.com").get();
// Here to get the names inside tag a
Elements links = doc.select("td a");
for (Element el : links) {
linkText = el.ownText();
arr_linkText.add(linkText);
}
//Here to get the names inside tag td
Elements linktwo = doc.select("td");
for (Element eltwo : linktwo) {
linkText = eltwo.ownText();
arr_linkText.add(linkText);
}
} catch (IOException e) {
// TODO Auto-generated catch block
e.printStackTrace();
}
我的問題是如何比這種方法更快地獲取名稱?也許這兩個代碼。
謝謝!
我希望有人能夠啓發我。 – Ammar 2013-02-24 08:01:29