2011-12-14 76 views
0

我不想重新發明輪子。我只需要一個好的PHP爬蟲程序,我可以用cron作業啓動,獲取SiteMap.xml文件。我知道編寫爬蟲是一項艱鉅的任務,有着常見的陷阱。任何好的圖書館來完成這個?使用第三方庫在PHP中生成SiteMap.xml?

回答

0

是的 - Zend框架有一個Sitemap view Helper您可能會使用。

+0

我是否被迫安裝整個Zend框架? – gremo 2011-12-14 18:41:58

0

儘管你提到你想要一個PHP抓取工具,但如果你使用的是一個普通的LAMP堆棧,你很可能會使用Apache,並希望你能夠訪問服務器端的其他語言。

對於我的PHP站點,我找到的最簡單的解決方案是用Python編寫的舊Google Sitemap Generator。簡單的config.xml文件,抓取apache訪問日誌進行鏈接生成。能夠與由PHP腳本生成的自定義URL列表+分數集成。