2013-08-23 46 views
4

我想上傳HDFS for Impala上的csv文件,並失敗很多時間。不知道這裏有什麼問題,因爲我遵循了指南。而且csv也在HDFS上。上傳Impala的CSV

CREATE EXTERNAL TABLE gc_imp 
       (
        asd INT, 
        full_name STRING, 
        sd_fd_date STRING, 
        ret INT, 
        ftyu INT, 
        qwerINT 
       ) 
ROW FORMAT DELIMITED FIELDS TERMINATED BY',' 
LOCATION '/user/hadoop/Gc_4'; 

我正在收到的錯誤。我正在使用Hue。

> TExecuteStatementResp(status=TStatus(errorCode=None, 
> errorMessage='MetaException: hdfs://nameservice1/user/hadoop/Gc_4 is 
> not a directory or unable to create one', sqlState='HY000', 
> infoMessages=None, statusCode=3), operationHandle=None) 

任何鉛。

回答

5

/user/hadoop/Gc_4必須是一個目錄。所以你需要創建一個目錄,例如,/user/hadoop/Gc_4。然後你上傳你的Gc_4。所以文件路徑是/user/hadoop/Gc_4/Gc_4。之後,您可以使用LOCATION指定目錄路徑/user/hadoop/Gc_4

LOCATION必須是一個目錄。 Hive和Impala中的這一要求相同。

+0

我做到了,但似乎我的問題仍然存在。是否因爲我使用Hue而不是shell命令。 – LonelySoul

+0

如果我使用擴展csv,這也有關係嗎?該文件表明,它不會,但我很懷疑。 – LonelySoul

1

這不是答案,而是解決方法。

在大多數情況下,我已經看到上傳的表格但「狀態」不成功。 另外,如果您在Hive的幫助下存儲了數據,從而爲您提供更多控制,那麼「請勿忘記刷新Impala UI上的元數據。」。非常重要。