我們希望在當前數據庫之上使用Amazon Elastic MapReduce(我們在EC2上使用Cassandra)。縱觀亞馬遜EMR常見問題,它應該是可能的: Amazon EMR FAQ: Q: Can I load my data from the internet or somewhere other than Amazon S3?爲Elastic MapReduce配置外部數據源
但是,創建一個新的工作流時,我們只能配置一個S3存儲作爲輸入數據源。
任何想法/樣品如何做到這一點?
謝謝!
P.S .:我見過這個問題How to use external data with Elastic MapReduce,但答案並沒有真正解釋如何做到/配置它,只是這是可能的。