我是hadoop mapreduce的新手。我想開發mapreduce代碼來轉換一個小文件的文本文件,但以前面的文件序列。這意味着在文件的實際順序,而不是類似於wordcount數據序列。所以可以給我什麼想法?如何在Hadoop中只包含案例?
0
A
回答
1
僅有逐行讀取文件中的行和然後發射它作爲關鍵值< < LineNumber上,UPPERCASEOFLINE >>,所以每一行的上殼將成爲減速器的值(A列表只有一個元素) 。
現在,所有你需要做的是發出的值(每個鍵單線)作還原劑的關鍵,你可以使減速器值爲NullWritable。
LineNumber在映射程序中,從1開始每增加1行輸入一次。 還重寫isSplitable()以返回false,以使一個文件完全由一個映射器處理。
+0
還需要編寫客戶記錄閱讀器嗎? – FourOfAKind 2012-10-07 21:45:17
0
我在通過hadoop map reduce程序將給定文本轉換爲大寫的同時面臨同樣的問題。
follwing是我的減速器代碼段
public static class UpperCaseReducer extends MapReduceBase implements Reducer<Text,Text,Text,Text>
{
public void reduce(Text key,Iterator<Text> value,OutputCollector<Text, Text> output,Reporter rporter) throws IOException
{
//while(value.hasNext())
{
String NULL= new String();
//System.out.println(value.toString());
output.collect(value.next(),new Text(""));
}
}
}
以我映射器代碼,我只讀取輸入的文本行,並通過線作爲其轉換成上殼體和使所述原始行鍵和轉換的文本作爲我的映射器方法的值作爲輸出。
相關問題
- 1. 如何在宏中包含唯一匹配案例的文檔?
- 2. 如何在Hadoop流媒體作業中包含python包?
- 3. 如何在PHP中包含檔案中心檔案
- 4. HTML輸入圖案驗證如果串只包含圖案
- 5. hadoop的使用案例
- 6. 方案:返回只包含LST
- 7. ImageView包含圖像的案例檢查
- 8. 在Hadoop中包含第三方Jars
- 9. Playframework:如何將JSON綁定到包含地圖的案例類?
- 10. 如何在Hive中包含jar(Amazon Hadoop env)
- 11. Hadoop:如何在Python中包含第三方庫MapReduce
- 12. 如何在DB2選擇案例中包含來自不同表的選擇
- 13. 如何只包含文件存在
- 14. 如何在包中包含示例或測試程序?
- 15. 在java檔案中包含文件
- 16. 如何在解決方案中包含快捷方式(.lnk)?
- 17. 如何在我的Java解決方案中包含servlet-api.jar?
- 18. hadoop,如何在嘗試運行mapred作業時包含3part jar
- 19. SQL Server 2000如何在案例陳述中形成案例?
- 20. 如何使用javascript在切換案例中調用案例?
- 21. 更改oracle中自定義列的名稱包含案例
- 22. 如何只包含彙編包含文件的部分
- 23. 如何在VSTS中只包含一個構建步驟來打包混合項目解決方案?
- 24. 如何包含在Symfony2中
- 25. 如何在Odoo中包含?
- 26. 如何在preg_replace中包含「#」?
- 27. 如何在HTTP響應中包含Cookie(例如圖片請求)?
- 28. 如何打印只包含一個子
- 29. 如何只包含@xml:lang屬性?
- 30. 如何選擇可能包含相同圖案的圖案?
查詢不清楚。 – 2012-07-25 07:01:43