使用SequenceFileInputFilter.Filter的,我可以看到SequenceFileInputFilter.Filter有accept方法,它會返回布爾,在這裏我們可以把檢查當前處理的關鍵,如果當前處理的關鍵是我們不感興趣的,我們可以從處理中跳過該行。什麼是Hadoop中
據我所知,在讀取序列文件的同時,hadoop從序列文件中獲得映射器輸入關鍵類信息(一些關於類的元數據)。 所以是有可能,一個序列文件中有不同類型的鍵類, 如果它不是可能的,那麼這將是實時使用Filter類的