2011-04-22 105 views
4

我在HDFS的data/2011/01/13/0100 /文件中有我的數據,每個文件都包含tab分隔的數據,比如name,ip,url。將數據從HDFS導入到Hive表

我想在Hive中創建一個表並從hdfs導入數據,表中應該包含時間,名稱,IP和URL。

如何使用Hive導入這些文件?數據應該採用其他格式,以便我可以導入時間?

+1

檢查此問題:http://stackoverflow.com/questions/9626789/how-can-i-partition-a-table-with-hive – 2012-04-17 21:43:43

回答

4

您需要創建該表將文件加載到,然後使用LOAD DATA命令將文件加載到Hive表中。請參閱Hive documentation以瞭解使用的精確語法。

問候, 傑夫

0

您可以創建這樣的數據的外部表。

喜歡的東西:

創建外部表log_data(名稱字符串,IP串,URL字符串) PARTITIONED BY(年BIGINT,月BIGINT,日BIGINT,小時BIGINT) 行格式分隔的字段被終止'\ t'存儲爲TEXTFILE 位置'data'

相關問題