我想了解一個示例hadoop項目。它具有以下的代碼塊如何爲SequenceFileInputFormat定義映射函數的鍵和值輸入?
jconf.setOutputKeyClass(Text.class);
jconf.setOutputValueClass(Text.class);
jconf.setInputFormat(SequenceFileInputFormat.class);
從this link,我讀到爲SequenceFileInputFormat,鍵和值是用戶定義的。我需要爲此實現RecordReader嗎?我沒有看到它在項目中實施。是否有任何默認分隔符用於將輸入分割分割爲鍵值對?
謝謝Esawara! 「序列文件中的鍵和值在創建時決定。」問題是如何?有沒有一個默認的分隔符用於識別密鑰,我沒有用於項目運行的樣本輸入,但是從我在代碼中看到的內容看來,期望密鑰成爲文件的路徑。 – learningtocode 2013-03-08 11:17:00
這裏沒有分隔符的概念。無論作爲創建序列文件的作業的輸出發出的輸出鍵和值都將自動用作後續作業中的輸入鍵和值。 – 2013-03-10 10:14:08