2012-04-25 99 views
1

我已經上傳我的數據 genotype1_large_ind_large.txt phenotype1_large_ind_large_1.txt獲取運行一個Amazon EMR工作

到S3系統時,「文件不存在」的錯誤,並在EMR UI,我喜歡設置參數下面

RunDear.run S3N://scalability/genotype1_large_ind_large.txt S3N://scalability/phenotype1_large_ind_large_1.txt S3N://可伸縮性/ output_1phe 33 10 4

以我類RunDear.run我將分發文件genotype1_large_ind_large.txt和phenotype1_large_ind_lar ge_1.txt到緩存

然而,在運行EMR後,我收到以下錯誤: java.io.FileNotFoundException:文件不存在:/genotype1_large_ind_large.txt

我很奇怪,爲什麼有斜線'/'在文件名前面? 如何使它工作?

我還試圖用像下面,但我的程序將-cacheFile作爲參數,從而也不起作用,

RunDear.run -cacheFile S3N://scalability/genotype1_large_ind_large.txt#genotype。 txt -cacheFile s3n://scalability/phenotype1_large_ind_large_1.txt#phenotype.txt s3n:// scalability/output_1phe 33 280 4

回答

0

我終於意識到這是使用文件系統的問題,所以我在程序中添加了一個代碼如下所示 FileSystem fs = FileSystem.get(URI.create(「s3:// scalability」),conf);