我想從S3上的兩個不同桶加載數據到Redshift表。在每個存儲桶中,都有名稱中包含日期的目錄,每個目錄包含許多文件,但沒有清單。AWS Redshift:從S3上的多個桶加載數據
例S3結構:
# Bucket 1
s3://bucket1/20170201/part-01
s3://bucket1/20170201/part-02
s3://bucket1/20170202/part-01
s3://bucket1/20170203/part-00
s3://bucket1/20170203/part-01
# Bucket 2
s3://bucket2/20170201/part-00
s3://bucket2/20170202/part-00
s3://bucket2/20170202/part-01
s3://bucket2/20170203/part-00
比方說,從兩個桶的數據爲20170201和20170202應該被加載。其中一個解決方案可以運行4次COPY命令 - 每個存儲桶的日期對。但我很好奇它是否可以在單個COPY呼叫中完成。我已經看到該清單文件允許指定幾個不同的文件(包括來自不同的桶)。但是:
- 是有選項可以使用的前綴,而不是完整的路徑在清單中,
- ,我可以用某種方式表現在SQL將它作爲一個字符串,而不是文件的位置 - 我想避免在S3上創建臨時文件?