0
我們正在使用Amazon Redshift從我們的S3存儲桶中提取數據。我們希望通過用HIVE或PIG代替Redshift來降低成本。作爲Amazon Redshift的替代方案,HIVE還是PIG?
我們可以使用HIVE或PIG從Amazon S3存儲桶中提取數據嗎?
我們正在使用Amazon Redshift從我們的S3存儲桶中提取數據。我們希望通過用HIVE或PIG代替Redshift來降低成本。作爲Amazon Redshift的替代方案,HIVE還是PIG?
我們可以使用HIVE或PIG從Amazon S3存儲桶中提取數據嗎?
Amazon Elastic MapReduce可用於部署Apache Hadoop集羣,包括Hive和Pig。
該羣集可以訪問S3中的數據,執行ETL操作並將數據保存回Amazon S3中。然而,這是一個相當複雜的系統,使用,也會產生費用(特別是如果你讓它整天運行)。
如果您擔心亞馬遜紅移的成本,有些選項是:
謝謝Jhon給你回答。讓我回來更多關於這個問題的統計數據 –
你嘗試過這麼遠嗎?不要問是否可以做到。相反,說「我試過使用HIVE提取數據,但在這一點上失敗......我做錯了什麼」。您目前的問題是Google搜索的候選人,而不是StackOverflow問題。 – StillLearnin
你能提供你的用例的更多細節嗎?你有多少數據?你是否在一天中運行查詢,或者只是在每日批處理中查詢?您目前的Redshift成本是多少? –