我使用火花流編程,但在scala中遇到了一些麻煩。我想使用的功能StreamingContext.fileStream火花流文件流
這個函數的定義是這樣的:
def fileStream[K, V, F <: InputFormat[K, V]](directory: String)(implicit arg0: ClassManifest[K], arg1: ClassManifest[V], arg2: ClassManifest[F]): DStream[(K, V)]
創建監視新文件在Hadoop兼容的文件系統,並使用它們讀取一個輸入流給出鍵值類型和輸入格式。文件名稱以。被忽略。 ķ 關鍵型讀取HDFS文件 V 值類型讀取HDFS文件 ˚F 輸入格式讀取HDFS文件 目錄 HDFS目錄監視新文件
我不知道怎麼打發鍵和值的類型。 我的火花流代碼:
val ssc = new StreamingContext(args(0), "StreamingReceiver", Seconds(1),
System.getenv("SPARK_HOME"), Seq("/home/mesos/StreamingReceiver.jar"))
// Create a NetworkInputDStream on target ip:port and count the
val lines = ssc.fileStream("/home/sequenceFile")
Java代碼編寫Hadoop的文件:
public class MyDriver {
private static final String[] DATA = { "One, two, buckle my shoe",
"Three, four, shut the door", "Five, six, pick up sticks",
"Seven, eight, lay them straight", "Nine, ten, a big fat hen" };
public static void main(String[] args) throws IOException {
String uri = args[0];
Configuration conf = new Configuration();
FileSystem fs = FileSystem.get(URI.create(uri), conf);
Path path = new Path(uri);
IntWritable key = new IntWritable();
Text value = new Text();
SequenceFile.Writer writer = null;
try {
writer = SequenceFile.createWriter(fs, conf, path, key.getClass(),
value.getClass());
for (int i = 0; i < 100; i++) {
key.set(100 - i);
value.set(DATA[i % DATA.length]);
System.out.printf("[%s]\t%s\t%s\n", writer.getLength(), key,
value);
writer.append(key, value);
}
} finally {
IOUtils.closeStream(writer);
}
}
}
你看到哪些問題?你有編譯錯誤嗎?如果是這樣,他們是什麼?當你運行你的代碼時,你會得到錯誤/意外的行爲嗎?如果您提供了更多的背景知識,您發現哪些錯誤/意外行爲更有可能得到有用的答案。 – cmbaxter