PHPcrawler - tmp文件

2012-04-02 59 views 0 likes

我下載了最新版本的phpcrawler，我可以訪問我自己的測試網站。PHPcrawler - tmp文件

我只是有一個形象，並在此網站的一些文字，我運行履帶和我收到的文本減去圖像，因爲我做了正確的$crawler->addNonFollowMatch("/.(jpg|gif|png)$/ i");

我不能讓它保存TMP文件它在我運行爬蟲程序的文件夾中沒有保存獨特的tmp文件，我試圖保存命名文件沒有運氣。

我在所有php文件的不同行上遇到了很多折舊錯誤，例如：@fopen,@在不同區域出現問題。我使用PHP，也可以做Regex。 David。

回答

我回答了我自己的問題，因爲我看到PHPCrawler問題真的沒有得到答案;我看到去年的一個問題沒有回答。我也會回答，儘管做任何好事可能爲時已晚。這是答案。

我在修改phpcrawler我調整我的需求增加：

$fp = fopen('c:/test/poopoo.txt','w'); 
fwrite($fp,($page_data['source'])); 
fclose($fp);

你把它沖洗文件之前並創建類的實例。

我發現使用PHP Simple HTML DOM Parser從this project運作良好。如果您需要更多控制權，請使用RegExp，但確實存在陡峭的學習曲線。

2012-04-05 11:03:23

恭喜修復，並感謝您尋找PHPCrawler子社區！如果可以，請確保將答案標記爲「已接受」，以便其他人可以從您的成功中學習。乾杯〜 – 2012-04-05 16:26:31

相關問題