我試圖從網頁中使用php cURL + preg_match或任何其他函數提取一些信息,但由於某些原因它根本不起作用。 例如,從this page, 我想提取「4牀房子出租, Caroline Place,Bayswater,W2」的標題,價格是「2,300」,並且以「This fantastic ... 「並結束於」(Circle and District Lines)「。 我試圖使用PHP cURL + DOM,但我得到了很多像這樣的錯誤「htmlParseEntityRef:expectcting';'在實體,行:243「和沒有結果顯示從一個html文檔中提取特定的部分,php cURL,php,preg_match
另外我試圖使用preg_match或preg_match_all但也不工作。
一個非常基本的例子將不勝感激!
我認爲,DOM解決方案無法正常工作,因爲頁面無效xhtml或xml – Michael 2010-05-04 18:43:08
也許發佈您嘗試過的正則表達式不起作用。這些模式看起來非常簡單。 – serg 2010-05-04 18:46:23
**不要使用正則表達式來解析HTML **,而是使用[html dom解析器代替](http://simplehtmldom.sourceforge.net/)它支持無效的HTML。 – 2011-08-18 00:25:30