創建一個簡單的正則表達式刮網址

-2

可能重複：
RegEx match open tags except XHTML self-contained tags
Grabbing the href attribute of an A element 創建一個簡單的正則表達式刮網址

我試圖颳去以下字符串的URL ...

<a class="uf" href="--"><b>Massage</b> Sacramento. Mae's Acupressure</a>

這裏是我現在得到的正則表達式...

<a class="uf" href="(.*?)">.*?<\/a>

但是，它在抓取頁面時沒有得到任何結果。

我在這裏做錯了什麼？

順便說一句，我在PHP中這樣做。

來源

2011-08-04 Chris R.

呃哦。注意，人們會試圖用正則表達式來解析URL ...在某處使用實際的解析器。 – kevlar1818

*（相關）* [解析HTML的最佳方法]（http://stackoverflow.com/questions/3577641/best-methods-to-parse-html/3577662#3577662） – Gordon

<a class="uf" href="[A-Za-z_-\.]*?">[A-Za-z_-\.]*?<\/a>

也不能忘記： RegEx match open tags except XHTML self-contained tags

來源

2011-08-04 17:03:35 Neal

其實您正則表達式工作得很好。你應該提供更深入的嘗試完成

試試這個什麼：

$content = 'something <a class="uf" href="--"><b>Massage</b> Sacramento. Mae\'s Acupressure</a> some other text'; 
preg_match('#<a class="uf" href="(.*?)">.*?</a>#', $content, $matches); 
print_r($matches); 
exit;

它會打印：

Array 
(
    [0] => <a class="uf" href="--"><b>Massage</b> Sacramento. Mae's Acupressure</a> 
    [1] => -- 
)

這是預期的結果，據我所看到

來源

2011-08-04 17:09:09

創建一個簡單的正則表達式刮網址

回答

相關問題