2012-07-26 53 views
2

我正在嘗試從IMDb中獲取人體高度,但該行包含#,它表示PHP中的註釋(例如# The comment as follows)。這裏是如何看起來像來自IMDB的源代碼:從IMDb獲取人體高度

<h4 class="inline">Height:</h4> 
5' 7&#34; (1.70 m) 

這是我嘗試的正則表達式:

<h4 class="inline">Height:</h4>\n([0-9' &#;(.)m]+)

我應該怎麼做,以防止它後發表評論正則表達式的其餘部分#角色?

在此先感謝!

編輯

這裏是添加\正則表達式的結果: enter image description here

+1

[取來自這裏的建議。](http://stackoverflow.com/questions/1732348/regex-match-open-tags-except-xhtml-self-contained-tags) – 2012-07-26 23:08:30

+3

請勿使用RegEx。 http://simplehtmldom.sourceforge.net/或http://php.net/manual/en/book.dom.php – 2012-07-26 23:08:59

+1

用\ \轉義它吧? – Radix 2012-07-26 23:09:45

回答

2

我已經解決了我的問題,下面是答案:

/<h4 class="inline">Height:<\/h4>\n([0-9\' ]+)&#34; ([0-9. m()]+)/

+1

drats!打了我一分鐘 - 把它放在船上。恭喜加1自給自足! – Radix 2012-07-26 23:27:47

+0

呵呵。非常感謝 :) – Erik 2012-07-27 00:13:50