2011-03-12 39 views
0

的序列文件創造價值一流的,我有一些類型的數據,我要對HDFS作爲序列文件上傳。在運行時

起初,我還以爲這取決於模式和使用RCC DDL工具的類型由Hadoop的創建這些類,並利用它們在運行時創建一個.jr文件。

但看RCC的文檔,我看到它已被棄用。我試圖看看還有哪些其他選項可以爲每種數據類型創建這些值類。

這是一個問題,因爲我瞭解在運行時與數據流一起被加載的數據的元數據。所以,我沒有選擇,只能在運行時創建Value類,然後用它寫入SequenceFile.Writer(key,vale),最後將它保存在HDFS上。

如果任何人心中都有這方面的任何解決方案,我將真正應用程式 感謝, JJ

回答

0

你可以嘗試尋找其他的序列化框架,如Protocol BuffersThriftAvro。您可能首先要看Avro,因爲它不需要生成靜態代碼,這可能更適合您。

或者,如果你想獲得真正的快速和骯髒的,在SequenceFile每條記錄可以是一個HashMap中,其中鍵/值的字段和值的名稱。