我試圖解析一些返回的html(從http://www.google.com/movies?near=37130)尋找當前正在播放的電影。我試圖匹配的模式看起來像:
<span dir=ltr>Clash of the Titans</span>
ruby正則表達式,解析html
其中有幾個在返回的HTML。
我試圖讓電影標題的使用下面的命令的數組:
titles = listings_html.split(/(<span dir=ltr>).*(<\/span>)/)
但我沒有得到我期望的結果。任何人都可以看到我的方法或正則表達式的問題?
請參閱http://stackoverflow.com/questions/1732348/regex-match-open-tags-except-xhtml-self-contained-tags/1732454#1732454 – 2010-04-03 15:34:55
此外,這個問題可能只是最糟糕的格式化問題永遠! – 2010-04-03 15:35:28
事情是,如果我不在代碼中發佈每一個小評論,總會有人嘮叨。所以我只是想避免這種情況。 – danwoods 2010-04-03 16:13:05