2013-10-14 28 views

回答

1

您的抓取存儲文件夾是在第一次寫入之後,此外,此文件不能自動刪除(重新抓取),因爲對文件的訪問被拒絕,所以第二次,程序檢查此文件並認爲所有網址都被抓取。您應該編輯crawler4j以完全關閉對抓取存儲文件夾的訪問。關注此: https://code.google.com/p/crawler4j/issues/detail?id=157