我想創建一個Hive表格,其中輸入文本文件遍歷到hdfs中的多個子目錄中。所以,比如我有HDFS:Hive:使用多個文件夾創建表格
/testdata/user/Jan/part-0001
/testdata/user/Feb/part-0001
/testdata/user/Mar/part-0001
and so on...
如果我想創建一個蜂巢表的用戶,但有它能夠遍歷用戶的子目錄,可以在做什麼?我嘗試過這樣的事情,但不行;
CREATE EXTERNAL TABLE users (id int, name string)
STORED AS TEXTFILE LOCATION '/testdata/user/*'
我認爲添加通配符會工作,但不會。當我嘗試不使用通配符仍然不起作用。但是,如果我將這些文件複製到用戶的根目錄中,那麼它就可以工作。 Hive是否無法遍歷子目錄並獲取這些文件?
這沒有奏效。其實,我應該提到我現在正在運行CDH3u1。 – user706794 2012-02-01 23:08:07
定義「沒有工作」。我還應該提到,您需要將您的目錄名稱更改爲month = Jan等... – 2012-02-01 23:11:02