回到我已發佈的HTML事物。試圖學習一點正則表達式,即使我知道還有其他方法。我不是啞巴,只是喜歡挑戰......Python正則表達式 - 在ExpressO不在IronPython中工作
我的表達是:
publisher.php\?c=.*?\">(.*?)</a>(?:.*?)<br\s\\>(?:[\s\r\n]*?)Date:\s<time\sdatetime="(.*?)\">(?:.*?)(?:[\s\r\n]*?)Pages:\s*?(\d*?)<br\s\\>
要匹配的東西:
<p>Country: <a href="country.php?c=it">Italy</a><br \>
Publication: <a href="publication.php?c=it/TL">Topolino (libretto)</a></p>
Publisher: <a href="publisher.php?c=Mondadori">Mondadori</a><br><br \>
Date: <time datetime="1970-11-22">November 22, 1970</time><br \>
Pages: 196<br \>
Price: 150 Lit. <br \>
<span class="indexedBy">Index delivered by: <a href="mag-inx.php?c=ABo">ABo</a></span>
如果我在快報測試,工作正常,但當我在Python中運行它,我的結果是沒有立即爲組1 ...
任何線索?
感謝,
中號
你爲什麼要用正則表達式處理HTML? – Tomalak 2011-01-11 12:21:31
學習?在我的腦海中,最好的方式來獲得Python和RegEx?因爲大家都說不要這樣做? :-) – Maurizio 2011-01-11 12:58:45
我已經更新了我的答案。 – 2011-01-11 13:10:48