如何將3個正則表達式組合成1個表達式 - 如果可能的話?
我想要得到的第一個標籤值的第一TD標籤值並使用該適當的正則表達式的ID從一個標籤。我一直在努力爭取一個小時才能將它們全部表達出來。解決方案是什麼?結合多個正則表達式組與前瞻
regex for th tag:
th[^>]+l">([^<]+)</th
regex for td tag:
td>([^<]+)</td
regex for a tag:
<a((?!</a).)id="([^"]+)"
我有一個像這樣的代碼片段的項目列表。
...
<th scope="col">1X2</th>
<th scope="col" class="goR">Odds</th>
</tr></thead>
<tbody>
<tr class="row1">
<td>Fortuna Köln</td>
<td class="prc "><label><a id="MarketGroupListComponent25-selection-38225206.1" />
...
怎麼樣正確的HTML解析庫,它爲您提供了更簡單的方式提取可能性,例如:https://jsoup.org/cookbook/extracting-data/selector-syntax - 如果有人添加評論到HTML Table的正則表達式擰例如 – zapl
感謝您的建議,我一定會檢查出來! – SzabK
@zapl如果html沒有正確寫入,例如使用非關閉的p標記,則解析器被擰緊。解析器可能是這裏最好的解決方案,但並不總是最好的解決方案。 –