我有很多10MB的日誌,我需要將它加載到HIVE中。以後我需要添加更多的日誌文件到現有的表中。任何人都可以幫助我嗎?如何將多個文件加載到Hive表中?
1
A
回答
9
只需使用標準蜂房語法:
LOAD DATA INPATH 'filepath' INTO TABLE tablename
在這裏的文件路徑可以參考:
- 相對路徑,如
project/data1
- 絕對路徑,如
/user/hive/project/data1
- 具有方案和(可選)權限的完整URI,例如
hdfs://namenode:9000/user/hive/project/data1
文件路徑可以是目錄,並且該目錄中的所有文件都將被移動到表中。
1
A)下面的命令可以使用多個時間來加載多個文件:
LOAD DATA INPATH 'file_1/path/hdfs' INTO TABLE tablename;
LOAD DATA INPATH 'file_2/path/hdfs' INTO TABLE tablename;
.......
or
LOAD DATA LOCAL INPATH 'file_1/path/local' INTO TABLE tablename;
LOAD DATA LOCAL INPATH 'file_2/path/local' INTO TABLE tablename;
....
INTO關鍵字附加文件之後的數據文件。不要錯誤地使用OVERWRITE。
B)當文件在一個目錄中:
LOAD DATA INPATH 'dir/path/hdfs' INTO TABLE tablename;
or,
LOAD DATA LOCAL INPATH 'dir/path/local' INTO TABLE tablename;
IMP:當目錄包含非數據文件(最有可能在HDFS),上述命令引發錯誤。例如,豬(或其他工具)生成了一個名爲my_data_dir的目錄。在my_data_dir下有兩個數據文件/my_data_dir/part-m-00000 & /my_data_dir/part-m-00001。還有一個名爲/my_data_dir/_logs
在這種情況下,日誌文件,如果你運行上面的命令提示錯誤提的日誌文件。刪除日誌文件和上面的命令工作正常。
2
爲什麼不通過指定某個位置並將文件轉儲到該特定位置來在Hive中創建外部表。您的外部表格將自動接收轉儲到該文件夾中的任何文件(如果模式相同)。
相關問題
- 1. 將多個文件加載到HIVE表中
- 2. 將csv文件加載到Hive表
- 3. 如何使用RegexSerDe將日誌文件加載到Hive表中?
- 4. 將Hive上下文加載到表中
- 5. 從文本文件中將多行xml數據加載到Hive表中
- 6. 如何將csv文件加載到具有多行列的Hive表格
- 7. Hive加載文件到表副本
- 8. 將多個文件加載到ssis中的多個表中
- 9. 將整個csv文件的內容加載到Hive表中的單個列中
- 10. 如何將多個文件中的數據加載到多個表中?
- 11. Ambari-將多個文件導入到Hive
- 12. 如何將一個Hive表指向多個外部文件?
- 13. 如何在更改後將數據加載到Hive表中?
- 14. 如何將數據加載到Hive表中
- 15. 如何將Postgress「文本」數據類型加載到HIVE中
- 16. bash腳本中的hive命令將不會將文件加載到表中
- 17. 在MYSQL中將多個CSV文件加載到單表中
- 18. 如何將多個文件模式加載到數據庫中?
- 19. 如何將多個文件加載到我的Excel工具中?
- 20. 如何將多個osm文件加載到Nominatim中
- 21. 使用sql加載器使用單個控制文件將多個數據文件加載到多個表中
- 22. 如何將多個文件(相同模式)加載到BigQuery中的表中?
- 23. RPostgreSQL將多個CSV文件加載到Postgresql表中
- 24. MySQL:將多個文件加載到表中
- 25. 我們可以直接將Parquet文件加載到Hive中嗎?
- 26. 如何將文本文件加載到存儲爲序列文件的Hive表中
- 27. HDFS與本地文件加載到Hive表中的數據
- 28. 使用Sqoop/Oozie從Hive將數據加載到Hive表
- 29. 將數據從.txt文件加載到表中作爲ORC存儲在Hive中
- 30. 如何使用SSIS包將Excel文件數據加載到多個表中?