2011-06-18 72 views
1

我想配置此Java爬蟲(http://code.google.com/p/crawler4j/)。但我很困惑,我怎麼能這樣做,因爲這是我第一次在這方面工作。我已經下載了所有那些寫在那個描述中的文件(「其中一個包含crawler4j jar文件和配置文件,另一個包含crawler4j的依賴關係,將所有這些文件放到你的類路徑中。」)但我是我的類路徑包含(。; C:\ Program Files(x86)\ Java \ jre6 \ lib \ ext \ Java.zip; C:\ apps \ apache \ tomcat7 \ lib \ servlet-api.jar; C:\ apps \ apache \ tomcat7 \ lib \ jsp-api.jar; C:\ apps \ apache \ tomcat7 \ lib \ el-api.jar)。 任何意見,將不勝感激,因爲我對此是新的..如何配置此Java爬蟲

+2

「的任何建議。」將這個項目擱置,直到階級道路的概念對你來說並不神祕。 「..將不勝感激..」着名的遺言。 ;) –

+0

@Andrew Thompson,我知道類路徑,但我怎麼能在我的類路徑中添加這兩樣東西..這就是我想知道的.. – ferhan

回答

0

使用通配符將兩個目錄添加到類路徑。詳情請參閱Setting the class path

+0

感謝您的回覆..有兩個文件夾:一個是crawler4j,包含因此,我應該在我的類路徑中添加這些東西: C:\ crawler \ crawler4j; C:\ crawler \ crawler4j-dependencies-lib; C:\ crawler4j-2.6.1和lib文件夾和第二個文件夾是crawler4j-dependencies-lib 履帶\ crawler4j \ lib中; C:\履帶\ crawler4j \ crawler4j-2.6.1 – ferhan

0

看看新crawler4j github上: https://github.com/yasserg/crawler4j

使用Maven依賴的系統和所有的麻煩將會消失!:

<dependency> 
    <groupId>edu.uci.ics</groupId> 
    <artifactId>crawler4j</artifactId> 
    <version>4.1</version> 
</dependency>