1
我開始在CakePHP 2.2中構建一個web爬蟲。 頁面,腳本正在爬行的是HTML頁面,我需要解析它們以獲取我的值。解析Cakephp中的HTML
已經嘗試了一些不同的解決方案,並查看了一些開源的東西,但不知道最好的辦法是做什麼。
- DomDocument :: loadHTML() - 看起來像這是解決方案,但不是100%確定。
- 正則表達式 - 硬有點維護
- 簡單HTMLDom - http://electrokami.com/coding/simple-html-dom-baked-cakephp-component(專爲蛋糕1.3,它的代碼的自我,是的,我不喜歡它 - ,得到了嚴重的內存泄漏(S))
要弄清楚,我應該使用哪種方法,我需要你的幫助。
它看起來像我應該使用PHP的DOM文檔,但找不到任何好的教程吧。 – 2012-07-24 18:41:08