當您在海夫(Hadoop的)與Amazon S3的源位置外部表是轉移到當地的Hadoop的HDFS上的數據:當您在Hive中使用S3位置創建外部表時,是否傳輸了數據?
- 外部表的創建
- 時奎雷斯(MR作業)是在外部表上運行
- 從不(沒有數據被轉移)和MR作業讀取S3數據。
S3讀取的成本是多少?將數據傳輸到HDFS是否有單一成本,或者是否存在數據傳輸成本,但是當由Hive創建的MapReduce作業在此外部表上運行時,會產生讀取成本。
一個例子的外部表的定義是:
CREATE EXTERNAL TABLE mydata (key STRING, value INT)
ROW FORMAT DELIMITED FIELDS TERMINATED BY '='
LOCATION 's3n://mys3bucket/';
(假設您的意思是財務成本)我不認爲您在同一個AWS區域內的S3和EC2之間的轉移收費http://aws.amazon.com/s3/pricing/ –