0
我想通過HtmlUnit從網頁中提取一些數據。這些數據是我的一些學生的名字和姓氏。該數據的組織是這樣的:HtmlUnit:從<span>中提取文本<a>標記
<td width='20%' align='left' valign='top' class='textstyle1'>
<a href='page.html' name='specName' class='seriousClass'>Secondname</a>,
<span class='textstyle2'>Firstname</span></td><td width='15%' align='center'
valign='top' class='textstyle2'> </td>
此刻,我只能提取secondname這樣的:
List studentsFieldList = page2.getElementsByName("specName");
for (int i = 0; i<studentsFieldList.size(); i++){
String lastName = ((Node)studentsFieldList.get(i)).getFirstChild().getNodeValue();
}
我不能得到的名字了。我嘗試使用
String firstName = ((Node)studentsFieldList.get(i)).getPreviousSibling().getFirstChild.getNodeValue();
但它不起作用。字符串是空的,儘管調試器在studentsFieldList對象中顯示了正確的值。
任何幫助將不勝感激。