2011-06-17 147 views
-1

的指數我有HTML代碼如下所示:獲取html元素

String html = "<html><head><style type=\"text/css\"></style></head><body><div style=\"font-family:times new roman,new york,times,serif;font-size:14pt\">first text<br><div><br></div><div style=\"font-family: times new roman,new york,times,serif; font-size: 14pt;\"><br><div style=\"font-family: times new roman,new york,times,serif; font-size: 12pt;\"><font size=\"2\" face=\"Tahoma\"><hr size=\"1\"><b><span style=\"font-weight: bold;\">one:</span></b> second text<br><b><span style=\"font-weight: bold;\">two:</span></b> third text<br><b><span style=\"font-weight: bold;\">three:</span></b> fourth text<br><b><span style=\"font-weight: bold;\">five:</span></b> fifth text<br></font><br>"; 

,我想知道如何獲得第三DIV的指數?

回答

0

DOM/XML解析器可能更好,這取決於你需要做什麼。但簡單的方法是:

int index = -1; 
for(int i=0; i < 3; i++){ 
    index = html.indexOf("<div",index + 1); 
    if(index == -1) 
     throw new Exception(); 
} 
4

我會用一個DOM解析器來做到這一點。如果你有正確的XML(有效的XHTML)內容,你也可以使用XML解析器。

而且要選擇哪個庫,this question可以幫助您。

更新:據我所知,您的內容是無效的XML。所以this question可能對你更好。

+0

是否有像我想要做的事情的樣本? –

+0

哪個?有效或無效部分? –

+0

你在說什麼是無效部分? –