我目前正在嘗試編寫一個正則表達式來將鏈接從我擁有的頁面中拉出。問題是僅當鏈接有「庫存」時才需要拉出鏈接。這是我有什麼代碼明智的輪廓:正則表達式 - 查找並比較單詞的第一個實例
<td class="prd-details">
<a href="somepage">
...
<span class="collect unavailable">
...
</td>
<td class="prd-details">
<a href="somepage">
...
<span class="collect available">
...
</td>
我想要做的是拉出來的鏈接僅當「收集可用」是在標籤。我曾嘗試用正則表達式來做到這一點:
(?s)prd-details[^=]+="([^"]+)" .+?collect{1}[^\s]+ available
然而上運行它,它會找到的第一個「珠三角細節」級和繼續下去,直到找到「收集可用」,從而採取不正確的結果。我認爲通過在收集單詞後指定{1},它只會使用它找到的單詞的第一個實例,但顯然我錯了。我一直在嘗試使用不同的東西,例如積極和消極的lookahead,但我似乎無法得到任何工作。
任何人都可以幫助我解決這個問題嗎?
感謝,
丹
你最好使用一個html解析器。 – kgiannakakis 2010-05-28 14:01:31
是的,但我受限於我使用的使用正則表達式的內部軟件。我們目前有一個這樣的地方,但它是v。長,並在每個標記之間,所以我們得到確切的結果 – Dan 2010-05-28 14:19:49
你的問題是關於正則表達式,不需要額外的標籤 – SilentGhost 2010-05-28 14:28:40