2014-11-06 41 views
-2

我有一個簡單的瀏覽器的「Hello World」小應用程序被稱爲:如何在簡單的Java應用程序中包含Nutch?

import java.awt.Graphics; 

public class CrawlCrowd extends java.applet.Applet 
{ 
    public void init() 
    { 
     resize(150,25); 
    } 

    public void paint(Graphics g) { 
     g.drawString("Hello world!", 50, 25); 
    } 

} 

我想包括Nutch,這樣我可以在applet的動態抓取網址。我如何去包含它並執行簡單的抓取?

+1

。對這個問題的一個很好的答案太長了,你基本上要求我們爲你做整個項目。如果這個過程的某個特定部分給了你一些問題,那就問一下。 – 2014-11-06 18:10:31

+0

我只想知道如何導入文件。我只是將該文件夾放在與我的CrawlCrowd文件相同的文件夾中,然後使用導入?我在5年內沒有碰到過java ...... – coderama 2014-11-06 18:11:47

回答

0

編寫一個web服務,它運行在您的服務器上。使用url列表從客戶端調用webservice。將URL寫入服務器端的種子文件中。

使用Apache公地-CLI在Web服務來運行的開始Nutch的腳本文件:標記以關閉

Executor exec = new DefaultExecutor(); 
exec.setWorkingDirectory(file); 
CommandLine cl = new CommandLine("./runCommand.sh"); 

int exitvalue = exec.execute(cl); 
if (exitvalue == 0) 
    System.out.println("./runCommand.sh succeeded...."); 
+0

我想要做到這一點的關鍵在於網絡上的每個單獨節點都必須能夠自己進行刮擦和處理。 – coderama 2014-11-07 11:46:41

相關問題