2016-05-15 55 views
-1

我有這樣的表達如何獲得一個正則表達式

<h3 id="productPageRightSectionTop-authors-h3">de <a id="productPageRightSectionTop-author-lnk" data-id="2316">José Saramago</a>; Ilustração: <a id="productPageRightSectionTop-entidade-lnk">João Caetano</a>&nbsp;</h3> 

我做了這個一個

<h3 id="productPageRightSectionTop-authors-h3">de <a id="productPageRightSectionTop-author-lnk" data-id="[0-9]+">(.+)</a> 

但越來越一切,我只是想這部分

<a id="productPageRightSectionTop-author-lnk" data-id="2316">José Saramago</a> 

你有任何想法我可以做到這一點?

+0

(http://stackoverflow.com/a/1732454/418066) – Biffen

回答

0

的問題是在正則表達式的結尾:

data-id="[0-9]+">(.+)</a>

(.+)太貪婪和事後相匹配的一切。 那部分更改爲:

data-id="[0-9]+">[^<]*</a>

應確定選擇。選擇器應該是這樣的:[!不解析與正則表達式HTML]

<h3 id="productPageRightSectionTop-authors-h3">de <a id="productPageRightSectionTop-author-lnk" data-id="[0-9]+">[^<]*</a>

+0

謝謝,它解決了這個問題。它的工作令人驚訝。也許你知道如何在表達式中間搜索結尾,例如%2F%? – user6236820

+0

現在我有這個'src =「https://images.portoeditora.pt/getresourcesservlet/image?EBbDj3QnkSUjgBOkfaUbsI8xBp%2F033q5Xpv56y8baM5A05y80e0FC%2FSoPzrzcwjT&width=250」',我必須保存鏈接...你會怎麼做?我認爲這是因爲我無法做到這一點,因爲我有其他的表達方式。 – user6236820

+0

要匹配scr中的鏈接,您可以使用: src =「[^」] +「或者如果您想將其放入變量: src =」([^「] +)」 – ntotomanov