我試圖在下列情況下工作:如何在HBase中存儲XML文件?
我有簡單的XML數據:
<main_tag> <x> <a>name value</a> <b>age value</b> </x> <y> <c>country value</c> <y> </main_tag>
我想上面的XML文件存儲在HBase的。我們該怎麼做?
如果我有大量的XML文件,我該如何將文件批量加載到HBase中?
在這兩種情況下,我最初都不想使用HDFS。
我試圖在下列情況下工作:如何在HBase中存儲XML文件?
我有簡單的XML數據:
<main_tag>
<x>
<a>name value</a>
<b>age value</b>
</x>
<y>
<c>country value</c>
<y>
</main_tag>
我想上面的XML文件存儲在HBase的。我們該怎麼做?
如果我有大量的XML文件,我該如何將文件批量加載到HBase中?
在這兩種情況下,我最初都不想使用HDFS。
你的第一個問題由@ravindra回答。對於第二個問題,您可以選擇批量加載,您可以使用map reduce讀取大量數據,並將其轉換爲HFile格式,然後使用批量加載命令將map reduce的輸出加載到Hbase。爲此,由於map reduce會從HDFS讀取數據,因此HDFS中應該有大量數據。
這也取決於你的數據。請查看here瞭解更多信息。
所以,我們必須使用HDFS批量加載xml數據嗎?你能否提供一個示例代碼,將大量的xml數據加載到hbase中 –
http://stackoverflow.com/questions/8173983/best-way-to-store-hierarchical-data-in-hbase –