2011-08-04 65 views
-2

可能重複:
RegEx match open tags except XHTML self-contained tags
Grabbing the href attribute of an A element創建一個簡單的正則表達式刮網址

我試圖颳去以下字符串的URL ...

<a class="uf" href="--"><b>Massage</b> Sacramento. Mae's Acupressure</a> 

這裏是我現在得到的正則表達式...

<a class="uf" href="(.*?)">.*?<\/a> 

但是,它在抓取頁面時沒有得到任何結果。

我在這裏做錯了什麼?

順便說一句,我在PHP中這樣做。

+0

呃哦。注意,人們會試圖用正則表達式來解析URL ...在某處使用實際的解析器。 – kevlar1818

+0

*(相關)* [解析HTML的最佳方法](http://stackoverflow.com/questions/3577641/best-methods-to-parse-html/3577662#3577662) – Gordon

回答

1

其實您正則表達式工作得很好。你應該提供更深入的嘗試完成

試試這個什麼:

$content = 'something <a class="uf" href="--"><b>Massage</b> Sacramento. Mae\'s Acupressure</a> some other text'; 
preg_match('#<a class="uf" href="(.*?)">.*?</a>#', $content, $matches); 
print_r($matches); 
exit; 

它會打印:

Array 
(
    [0] => <a class="uf" href="--"><b>Massage</b> Sacramento. Mae's Acupressure</a> 
    [1] => -- 
) 

這是預期的結果,據我所看到