1
我想用hadoop處理protobufs ....但我不確定從哪裏開始。 我不在乎分裂大文件。 的protobufs存儲爲二進制數據...我應該擴展一下班,使其更容易在hadoop中處理protobufs的自定義inputformat 0.20
我想用hadoop處理protobufs ....但我不確定從哪裏開始。 我不在乎分裂大文件。 的protobufs存儲爲二進制數據...我應該擴展一下班,使其更容易在hadoop中處理protobufs的自定義inputformat 0.20
elephant-bird可以使用Hadoop處理protobufs。該框架與常規protobuf類一起生成hadoop I/O類。它使用lzo壓縮。
想通過擴展FileInputFormat和RecordReader來實現它。不得不挖掘hadoop源代碼來獲得一個想法......但事情現在工作很好... – griffin 2011-03-12 00:19:43
@grifin格里芬 - 你爲什麼不與我們其他人分享你的解決方案? – rjurney 2016-10-25 19:45:21