2016-09-19 58 views
3

我想從我的Java的機器上遠程運行豬腳本,執行PigServer爲我寫了下面的代碼錯誤在Java中

代碼:

import java.io.IOException; 
import java.util.Properties; 
import org.apache.pig.ExecType; 
import org.apache.pig.PigServer; 
import org.apache.pig.backend.executionengine.ExecException; 

public class Javapig{ 
public static void main(String[] args) { 
try { 
    Properties props = new Properties(); 
    props.setProperty("fs.default.name", "hdfs://hdfs://192.168.x.xxx:8022"); 
    props.setProperty("mapred.job.tracker", "192.168.x.xxx:8021"); 

    PigServer pigServer = new PigServer(ExecType.MAPREDUCE, props); 
    runIdQuery(pigServer, "fact"); 
    } 
    catch(Exception e) { 
     System.out.println(e); 
    } 
} 
public static void runIdQuery(PigServer pigServer, String inputFile) throws IOException { 
    pigServer.registerQuery("A = load '" + inputFile + "' using org.apache.hive.hcatalog.pig.HCatLoader();"); 
    pigServer.registerQuery("B = FILTER A by category == 'Aller';"); 
    pigServer.registerQuery("DUMP B;"); 
    System.out.println("Done"); 
} 
} 

但在執行下面我列舉越來越錯誤。

錯誤

ERROR 4010: Cannot find hadoop configurations in classpath (neither hadoop-site.xml nor core-site.xml was found in the classpath). 

我不知道我做錯了。

回答

1

好,自描述錯誤...

既不的hadoop-site.xml中也沒有核心的site.xml在classpath中發現

您需要這兩個文件在classpath的應用程序。

您理想會得到那些來自你的$HADOOP_CONF_DIR文件夾,你會它們複製到Java的src/main/resources,假設你有一個Maven結構

而且,與這些文件,你倒是應該使用Configuration對象Hadoop的

PigServer(ExecType execType, org.apache.hadoop.conf.Configuration conf)