2012-04-02 59 views
0

我下載了最新版本的phpcrawler,我可以訪問我自己的測試網站。PHPcrawler - tmp文件

我只是有一個形象,並在此網站的一些文字,我運行履帶和我收到的文本減去圖像,因爲我做了正確的$crawler->addNonFollowMatch("/.(jpg|gif|png)$/ i");

我不能讓它保存TMP文件它在我運行爬蟲程序的文件夾中沒有保存獨特的tmp文件,我試圖保存命名文件沒有運氣。

我在所有php文件的不同行上遇到了很多折舊錯誤,例如:@fopen,@在不同區域出現問題。我使用PHP,也可以做Regex。 David。

回答

0

我回答了我自己的問題,因爲我看到PHPCrawler問題真的沒有得到答案;我看到去年的一個問題沒有回答。我也會回答,儘管做任何好事可能爲時已晚。這是答案。

我在修改phpcrawler我調整我的需求增加:

$fp = fopen('c:/test/poopoo.txt','w'); 
fwrite($fp,($page_data['source'])); 
fclose($fp); 

你把它沖洗文件之前並創建類的實例。

我發現使用PHP Simple HTML DOM Parserthis project運作良好。如果您需要更多控制權,請使用RegExp,但確實存在陡峭的學習曲線。

+0

恭喜修復,並感謝您尋找PHPCrawler子社區!如果可以,請確保將答案標記爲「已接受」,以便其他人可以從您的成功中學習。乾杯〜 – 2012-04-05 16:26:31