我有一個mapreduce程序,其輸出全部在文本文件中。該程序的一個示例如下。 我不知道該怎麼做,是從reducer輸出序列文件格式的鍵/值對。 不,我不能因爲我使用Hadoop的0.20庫 所以,我該怎麼辦使用SequeceFileFormat符?以下是樣本 wordcount程序只是我的大型程序的一小部分。如果我知道如何做到這一點,我可以和其他人一起做。 請幫忙。 字數減速 public vo
我讀了hadoop-1.0.4源代碼中的SequenceFile.java。我發現sync(long)方法 它被用於在SequenceFile中將SequenceFile拆分爲MapReduce中的文件拆分時,在SequenceFile中查找「同步標記」(在文件創建時生成時爲16字節的MD5)。 /** Seek to the next sync mark past a given positio