我試圖在JAVA中的標籤之間獲取文本。正則表達式在標籤之間獲取文本
`
<td colspan="2" style="font-weight:bold;">HELLO TOTO</td>
<td>Function :</td>
`
我想用正則表達式來提取 「HELLO TOTO」,而不是 「功能:」
我已經嘗試過這樣的事情
`
String btwTags = "<td colspan=\"2\" style=\"font-weight:bold;\">HELLO TOTO</td>\n" + "<td>Function :</td>";
Pattern pattern = Pattern.compile("<td(.*?)>(.*?)</td>");
Matcher matcher = pattern.matcher(btwTags);
while (matcher.find()) {
String group = matcher.group();
System.out.println(group);
}
`
但結果與輸入相同。 任何想法?
我想這正則表達式(?<=<td>)(.*?)(?=</td>)
太多,但它唯一的缺點「功能:」 我不知道的設置,他可能是開放<td ...>
由於已經經過一些提前
源XHTML?如果是這樣,我會使用XML解析器和XPATH。 – Roger
嘗試Jsoup庫,請在下面找到鏈接 https://jsoup.org/ –
使用組(2);以獲取標籤內的內容 – Aelop