2011-08-14 22 views
0

我試圖讓我的周圍頭的正則表達式更詳細的HTML頁面解析信息的段落..在Perl

我試圖提取以下html頁面的每個段落:

+3

[你不應該嘗試用正則表達式解析HTML](http://stackoverflow.com/questions/1732348/regex-match-open-tags-except-xhtml-self-contained-tags/1732454#1732454) – Bohemian

+1

使用[HTML :: Parser](http://search.cpan.org/dist/HTML-Parser/),不要浪費你的時間試圖想出一個脆弱的自制解析器。 –

+0

Web :: Scraper是一個很好的工具。 –

回答

1

你可以還要看看pQuery(它是jQuery的Perl端口),我發現它非常有用。

+0

[HTML :: Query](http://p3rl.org/HTML::Query)和[Web :: Query](http://p3rl.org/Web::Query)更好。 – daxim