2014-07-06 44 views
-3

全部。我使用jsoup css seletor進行網頁抓取,但不知道如何獲取2個標籤之間的文本。如下圖所示:使用Jsoup CSS選擇器爲2個元素之間的文本

<html>
<body>

<a名稱= 「XXX」 >一些文本這裏</a>

<a名稱= 「ABC」 >文本1 </a>`

我想在這裏獲取文本

<a名= 「CDE」 >文本1 </a>

</body> 
</html> 

<a>屬性名稱是在HMTL獨特

我發現大多數答案是提取<a></a>

人之間的文本知道這個怎麼做。非常感謝

回答

0

OK我做了這個小碼我

String html = "<html> <body><a name = xxx > some text here</a><a name = abc> the text 1 </a>i wanna get the text here<a name = cde>the text 1 </a></body></html>"; 
    Document doc = Jsoup.parse(html); 
    String body = doc.body().toString(); 
    String[] a = body.split("</a>"); 
    String lista = a[2]; 
    String[] listb = lista.split("<");  
    String textBetweenA = listb[0]; 
    System.out.println(textBetweenA); 
+0

@aeTechMoy,它不工作就工作。請檢查我的html源碼已更新。在標籤之前,沒有任何元素包含標籤。 – jagabee

+0

我也編輯了我的答案 – zeTechMoy

+0

謝謝@aeTechMoy。這個對我有用。 – jagabee