在Hue - > Hive查詢瀏覽器中,我在Hive中創建了一個外部表,並使用以下語句將數據從我的一個CSV文件加載到它中:Hive:即使當表是外部時,源數據也被移動到hive數據倉庫
CREATE EXTERNAL TABLE movies(movieId BIGINT, title VARCHAR(100), genres VARCHAR(100)) ROW FORMAT DELIMITED FIELDS TERMINATED BY ',' LINES TERMINATED BY '\n' STORED AS TEXTFILE;
LOAD DATA INPATH '/user/admin/movie_data/movies' INTO TABLE movies;
我看到源文件「電影」從HDFS中消失並轉移到配置單元數據倉庫。我的印象是外部表格只能作爲原始源數據的鏈接。
如果外部表不是獨立於源數據 - 如果我要刪除表,源文件仍然會保留?我如何創建這樣的外部表格?
是否沒有辦法創建只是「指針」的外部表到源數據並獨立於它(如在元數據表中)?這就是文檔似乎談論的內容。 –
當您使用外部關鍵字創建表格時,其外部表格指向hdfs位置。備份數據並刪除表格,數據不會被刪除...只要看看它就可以了。 –