我對使用Avro保存和讀取Hadoop HDFS中的文件感興趣,我看到Hadoop問題跟蹤器中的一些Jira有關實現對Avro的支持,但沒有示例說明如何在Hadoop中啓用Avro支持。另外我還不完全確定目前的0.20支持Avro,因爲一些Jira的收盤價爲0.21。是否有可能獲得最新的0.21,並以某種方式打開Avro並使用它?是否有可能在Hadoop 0.20中使用Avro?
0
A
回答
0
我正在使用Avro與Hadoop 0.20(Amazon Elastic MapReduce)。通過在類路徑中包含Avro jar來啓用Avro支持,然後擴展Avro提供的類以實現Map和Reduce任務。
參見http://avro.apache.org/docs/1.4.0/api/java/index.html,特別是映射包http://avro.apache.org/docs/1.4.0/api/java/org/apache/avro/mapred/package-frame.html。
3
此博客文章展示了在地圖/縮小作業中使用Avro的一些示例代碼:http://www.datasalt.com/2011/07/hadoop-avro/這裏沒有太多例子。在這裏你可以找到一些關於如何配置一個標準的Map/Reduce Job來使用Avro作爲輸入或輸出格式或者兩者都使用的代碼片段。還有一些技巧,比如如何編寫一個自定義的GroupComparator進行二次排序,或者如何指定一個自定義的Partitioner(我在其他地方找不到的東西)。
相關問題
- 1. 如何在Hadoop 0.20中使用MultipleoutputFormai?
- 2. Hadoop 0.20中沒有KeyValueTextInputFormat(新的MapReduce API)*
- 3. NLinesInputFormat在Hadoop 0.20中的替代?
- 4. 是否有可能在.NET中使用DataContractSerializer'有時'使用EmitDefaultValue?
- 5. 是否有可能使用就是hbm2ddl
- 6. 是否有可能在GLSL
- 7. 是否有可能在GSA
- 8. 是否有可能使AIDL
- 9. 是否有可能在iPhone
- 10. 是否有可能檢測到Java中是否有類可用?
- 11. 是否有可能在Ext.grid.column.Action
- 12. 是否有可能在python
- 13. 是否有可能在Java
- 14. 是否有可能在IDA
- 15. 是否有可能在iOS
- 16. 是否有可能在android
- 17. 是否有可能在iPhone
- 18. 是否有可能在IIS 5中使用Castle MonoRail Routing功能?
- 19. 是否有可能在android
- 20. 是否有可能在Android
- 21. 是否有可能在Struts2中使用不可變類?
- 22. 是否有可能在WPF
- 23. 是否有可能在Javascript
- 24. 是否有可能在
- 25. 是否有可能在Python中使用svm_model,在matlab中生成?
- 26. 是否有可能有RelativeLayouts在RadioGroup中
- 27. 是否可以在Hadoop 1中使用Impala(不含YARN)?
- 28. 是否有可能在android
- 29. 是否有可能在XSLT
- 30. 是否有可能在PhantomJS