是否可以定製Nutch Fetcher課程？

我成功地將網頁鏈接和索引數據抓取到solr。
但我需要爲所有鏈接創建一個pdf文件，該鏈接將被抓取並索引到Solr中。我知道幻影會給我pdf，但我不明白我在哪裏配置幻影Nutch。我搜索了一下，我知道我需要自定義Nutch的Fetcher類，但我不知道如何定製它。請任何人都可以幫忙。我從最近兩週就陷入了這個問題。是否可以定製Nutch Fetcher課程？

來源

2016-03-30 Sagar Patel

可否請你澄清多一點，這是很難理解是你想在這裏實現什麼樣的任務。你想要列出你到目前爲止已經爬過的所有網址嗎？ –

@SujenShah我想爲所有的網址創建pdf，這個網址將被nutch抓取。所以我需要知道在哪個類中我需要改變，所以它會創建pdf。（我使用phantomjs來創建pdf）。因爲我知道只有我需要把代碼放在創建PDF的任何類中，但直到現在我沒有找出課程。 –