2012-10-14 207 views
3

我開始學習HBASE,我有一項任務,但我不知道從哪裏開始。 我有一個XML數據庫,我應該將其導入HBASE。如何將XML數據庫導入HBASE

示例文件:https://www.dropbox.com/s/e47itzrqg36kuci/pub-venues.xml

我知道如何創建一個表,並導入CSV文件到它。但問題是,csv文件有行,每個字段的數量是不變的,我的意思是即使沒有值,字段之間仍然存在逗號。 請幫我,告訴我在哪裏可以找到關於它的一些信息。謝謝。

回答

-1

有很多方法可以在HBase中表示XML(從一個列中將其存儲到單獨一行中的每個元素開始)。當談到建模HBase時,您需要考慮的是如何從中訪問數據和設計。

+0

在這種情況下,每個不同的TAG將成爲一列。在這個示例文件中有一個名爲pub-venue的父TAG,這將是一排。 –