2015-06-11 53 views

回答

1

BulkLoad與HFile一起使用。所以如果你有HFile,你可以直接使用LoadIncrementalHFiles來處理批量加載。 通常我們使用Map reduce,它可以將數據轉換爲上述格式,並執行批量加載。 如果您有csv文件,則可以使用ImportTsv實用程序將您的數據處理爲HFile。請使用this link,以獲取更多信息 這取決於您當前數據的格式。 需要指出的是,批量加載不使用預寫日誌(WAL)。他們跳過這一步並以更快的速度添加數據。如果您有任何其他框架取決於上述WAL,請考慮在Hbase中添加數據的其他選項。快樂編碼。

+0

我有大量的小PDF文件(2m +),我會將它們插入到HBase中。我嘗試過直接投入,但是我遇到了WAL問題。所以我想使用BulkLoad,但是我不能使用mapreduce,因爲我無法在HDFS上移動這些文件,我會飽和所有Inodes,因爲它們是非常多的小文件。 – Pennywise83

+0

請添加您的問題:)。我假設,你想添加大量的PDF文件到Hbase,並試圖使用put,但沒有成功。所以你想使用批量加載,但不使用mapreduce。所以想要一個替代解決方案簡而言之 - 許多pdf,hbase存儲,批量加載,無mapreduce。我對嗎 – Ramzy