2012-10-22 44 views
-3

我想寫一個正則表達式來解析這個網頁(view-source:http://www.imdb.com/search/title?title = spiderman & title_type = feature)。基本上我想提取<tr class=".+"></tr>之間的所有部分。此網頁是來自imdb的電影列表(http://www.imdb.com/search/title?title=spiderman & title_type = feature),此處的每個部分均指示電影。我試過正則表達式如何爲此目的編寫正則表達式?

<tr class=".+">(.+\n)+</tr> 

但是,它不起作用。另外,我不允許使用DOM。有沒有人有什麼建議?謝謝!

+1

爲什麼不允許使用DOM? – alex

回答

0

我強烈建議您使用合適的解析器。但這裏是你的情況的正則表達式。

<tr class="(.+)">([\s\S]+?)</tr> 
+0

謝謝,夥計!這個解決方案非常棒!我不能使用解析器,因爲這是一個學校項目,教授希望我們練習正則表達式。 – Fey